JP2005196806A - 文字コード変換システム - Google Patents

文字コード変換システム Download PDF

Info

Publication number
JP2005196806A
JP2005196806A JP2005060822A JP2005060822A JP2005196806A JP 2005196806 A JP2005196806 A JP 2005196806A JP 2005060822 A JP2005060822 A JP 2005060822A JP 2005060822 A JP2005060822 A JP 2005060822A JP 2005196806 A JP2005196806 A JP 2005196806A
Authority
JP
Japan
Prior art keywords
character code
character
code
data
conversion table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005060822A
Other languages
English (en)
Inventor
Takaaki Fujiyoshi
高彰 藤吉
Koji Kawahara
功治 川原
Hiroyuki Furusawa
宏之 古澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2005060822A priority Critical patent/JP2005196806A/ja
Publication of JP2005196806A publication Critical patent/JP2005196806A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】テキストデータの文字コードを変換する処理の負荷が小さく、文字コード変換テーブルの必要数が少なく、外字コード変換テーブルを変更する処理が容易な文字コード変換システムを提供する。
【解決手段】標準コード、第1、第2の変換テーブルとから成る複数の変換テーブルを使用し所定の文字コードを変換処理する文字コード変換システムである。標準コード変換テーブルには第1と第2の文字コード体系の標準コード文字の共通文字コードを変換するデータが記述され、第1の変換テーブルには非共通文字コードを各外字コードに変換するデータが記述され、第2の変換テーブルにはいずれでもない文字コードを第1または第2の各文字コード体系の各外字コードに変換するデータが記述されている。
【選択図】 図1

Description

本発明は、異なる文字コード体系を有するシステムの間でテキストデータの配給受領を行う際に使用される複数のシステムに関する。そのシステムは、変換テーブルに文字コードが登録されているか否かを検証するシステム、その変換テーブルを使用して異なる文字コード体系の間でテキストデータの文字コードを変換するシステム、および、その変換テーブルに登録されていない外字コードをデータテーブルに登録するシステムである。特に、テキストデータの配給側システムにおける外字コード登録等の処理が必要なく、登録されていない文字コードがある場合でもテキストデータの受領側システムで判定処理を行うことにより、異常停止、異常変換等を生じないシステムに関する。
現代の社会活動では、キャッシュカード、クレジットカード、IDカード、など種々の個人情報記録媒体が利用されており、その発行枚数は益々増加する傾向にある。たとえば、カードとしての形態をもった個人情報記録媒体としては、ICカード、カラー印刷カード、磁気カード、エンボスカード、などが一般的に利用されており、同一人に対して、これら種々の形態のカードがそれぞれ発行されることも少なくない。また、発行したカードを郵送する場合には、封筒中でカードを支持固定するための郵送台紙が必要であり、この郵送台紙にも宛名や名前などの個人情報が印字されることになる。したがって、この郵送台紙も、個人情報記録媒体のひとつである。
これら種々の形態の媒体を発行するシステムに入稿されるテキストデータは、通常はそれらのシステムと異なるシステムで作成される。たとえば、社員の人事情報を管理する人事管理システムで使用されているテキストデータを用いて、IDカード発行システムに入稿する等である。ところで、テキストデータを記述する文字コード体系には1バイト系の文字コードとしてEBCDIC、JIS等、2バイト系の文字(漢字)コードとしてSHIFT-JIS、JEF、IBM等のように種々の文字コード体系がある。
そこで問題となるのは、システムによってその文字コード体系が異なっているという点である。これはコンピュータやオペレーティングシステム(OS)によってテキストデータの文字体系が異なっているためである。しかも、それぞれの文字コード体系が標準としている文字種やその数が異なっている。特に、人名等で用いられる文字コード体系外の文字は外字として、各システムにおいて、それぞれ特定のコードを割付けて登録管理される。その外字コードは、システム固有のコードが割付られており、他のシステムにおいてはそのコードがいかなる文字に対応していのかがテキストデータだけからは判定できない。
したがって、それぞれの供給側システムに対応した外字コード変換テーブルを受領側システムが保持する、あるいは、それぞれの受領側システムに対応した外字コード変換テーブルを供給側システムが保持する必要がある。しかし、外字コード変換テーブルの数はシステムの組合せの数だけ必要であり作成し保持する数が膨大となり、またテキストデータによって使用される外字は異なるから、新たな外字が含まれる度に外字コード変換テーブルを変更する膨大な処理が必要である。またテキストデータはファイル単位で変換処理されるが、変換処理を行って新たな外字が含まれることが判明した場合、その外字を変換テーブルに登録した後再度変換する、あるいは、新たな外字が含まれるレコードまたはフィールドを別ファイルとして分離し、別過程で対策を施し変換処理を行った後にマスターファイルと結合する処理を必要とし、処理時間等の処理負荷が大きい。
そこで本発明の目的は、テキストデータの文字コードを変換する処理の負荷が小さく、文字コード変換テーブルの必要数が少なく、外字コード変換テーブルを変更する処理が容易な文字コード検証、変換および登録システムの内の文字コード変換システムを提供することにある。このシステムによれば、テキストデータの配給側システムにおける外字コード登録等の処理が必要なく、登録されていない文字コードがある場合でもテキストデータの受領側システムで判定処理を行うことにより、異常停止、異常変換等を生じない。
上記の目的は下記の本発明によって達成される。すなわち、本発明は、所定の文字コードを複数の変換テーブルの内で前記所定の文字コードが登録されている変換テーブルを使用し変換処理する文字コード変換システムであって、前記変換テーブルは、標準コード変換テーブルと、第1の変換テーブルと、第2の変換テーブルと、から成り、前記標準コード変換テーブルには、第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字と、の共通文字の文字コードを変換するデータが記述され、前記第1の変換テーブルには、前記第1の文字コード体系の標準コード文字と、前記第2の文字コード体系の標準コード文字と、の非共通文字の文字コードを前記第1または前記第2の各文字コード体系の各外字コードに変換するデータが記述され、前記第2の変換テーブルには、前記第1の文字コード体系の標準コード文字と、前記第2の文字コード体系の標準コード文字と、のいずれでもない文字コードを、前記第1または前記第2の各文字コード体系の各外字コードに変換するデータが記述されている文字コード変換システム、である。
本発明の文字コード変換システムによれば、変換処理により所定の文字コードが複数の変換テーブルの内で前記所定の文字コードを登録している変換テーブルが使用され変換される。
また本発明の文字コード変換システムよれば、それらで使用される変換テーブルは、標準コード変換テーブルと、第1の変換テーブルと、第2の変換テーブルとから成り、標準コード変換テーブルは、第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字と、の共通文字の文字コードを変換するデータを記述し、第1の変換テーブルは、第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字と、の非共通文字の文字コードを第1または第2の各文字コード体系の各外字コードに変換するデータを記述し、第2の変換テーブルは、第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字と、のいずれでもない文字コードを、第1または第2の各文字コード体系の各外字コードに変換するデータを記述する。このような変換テーブルの構成により、テキストデータ配給受領システムにおける変換テーブルの必要数とデータ容量を大幅に削減することができる。
以上のように本発明によれば、テキストデータの文字コードを変換する処理の負荷が小さく、文字コード変換テーブルの必要数が少なく、外字コード変換テーブルを変更する処理が容易な文字コード検証、変換および登録システムの内の文字コード変換システムが提供される。このシステムによれば、テキストデータの配給側システムにおける外字コード登録等の処理が必要なく、登録されていない文字コードがある場合でもテキストデータの受領側システムで判定処理を行うことにより、異常停止、異常変換等を生じない。また、 テキストデータを受領側システムに変換する処理時間を低減でき、 配給側(入稿側、得意先)のシステムごとに管理する外字コード変換テーブルの情報量が減り、登録作業の負荷が小さく、 未登録外字を含むテキストデータファイルを一度入稿した後、フィールド単位で変換処理を施せ、 配給側と受領側の両システムで定義する外字を統一できる。
以下、本発明について好適な実施例に基づいて説明する。図1は本発明のシステムの構成を示す図である。図1においては後述するように、本発明の文字コード変換システムは文字コード検証システム、文字コード登録システムとともに協調して利用される個別のシステムでありネットワークを通じて接続される構成が示されている。しかし、これらシステムは、他のシステムの一部を構成するものであってもよく、またこれらシステムの組合せにより1つのシステムを構成するものであってもよい。ここでは、各システムの構成と動作を明確にするため個別システムとして示す。
図1において、1は文字コードが複数の変換テーブルに登録されているか否かを検証処理する文字コード検証システム、2は所定の文字コードを複数の変換テーブルの内でその所定の文字コードが登録されている変換テーブルを使用し変換処理する文字コード変換システム、3は変換テーブルに基づいてコード変換された文字コードを第1のデータテーブルに登録処理し、その他の文字コードを第1の管理テーブルと第2の管理テーブルに登録処理する文字コード登録システム、4はイーサネット等のLAN(LocalAreaNetwork)、5はテキストデータ、変換テーブル、管理テーブル等のデータを保存管理するデータストアシステム、6,8,10はキーボード,マウス等の入力手段、7,9,11はディスプレイ,プリンター等の出力手段、である。
図1において、文字コード検証システム1はさらに細部から構成されている。12は記憶手段、13は演算手段であり、これらはパーソナルコンピュータ、ワークステーション等のコンピュータの本体である。また記憶手段12において、14はテキストデータ、15は変換テーブルであり、演算手段13において、16は検証処理ルーチンである。また、文字コード変換システム2はさらに細部から構成されている。17は記憶手段、18は演算手段であり、これらはパーソナルコンピュータ、ワークステーション等のコンピュータの本体である。また記憶手段17において、19はテキストデータ、20は変換テーブルであり、演算手段18において、21は変換処理ルーチンである。同様に、文字コード登録システム3はさらに細部から構成されている。22は記憶手段、23は演算手段であり、これらはパーソナルコンピュータ、ワークステーション等のコンピュータの本体である。また記憶手段22において、24はテキストデータであり、25は変換テーブルであり、26は管理テーブルであり、演算手段23において、27は登録処理ルーチンである。
図2は本発明の文字コード変換システムとともに協調して利用される文字コード検証システム、文字コード登録システムを組合わせたシステムにより行われるテキストデータ受領処理の処理過程を示すフローチャートである。図1、図2に基づいて本発明のシステムの動作を説明する。まずデータストアシステム5に格納されているテキストデータが文字コード検証システム1の記憶装置12に読込まれる(S1)。読込まれたテキストデータ12から処理対象として文字コード(i)が1つ演算手段13に読込まれる(S2)。一方、データストアシステム5に格納されている変換テーブルも記憶装置12に読込まれ、その変換テーブル15に文字コード(i)が登録されているか否かが検証される。この検証は検証処理ルーチン16によって行われる(S3)。
文字コード(i)が登録されている場合には(S4)、文字コード変換システム2において、変換テーブル20(変換テーブル15と同一)を参照して、文字コードの変換が行われる。この変換は変換処理ルーチン21によって行われる(S5)。文字コード(i)が登録されていない場合には、文字コードの変換は行われず、次の処理に進む(S4)。
文字コード登録システム3において、文字コード(i)が変換されれば、変換された文字コードを第1の管理テーブルに登録する。また文字コード(i)が変換されなければ、その文字コード(i)とその文字コード(i)のテキストデータ中の場所(たとえば“i”)を第2の管理テーブルに登録する。また、必要に応じて変換テーブル24(初期状態は変換テーブル20と同一)に文字コード(i)を登録する。この登録は登録処理ルーチン27によって行われる(S6)。iをi+1に更新する(S7)。iが最終値であれば終了とし、そうで無い場合にはS2に戻り上述の処理を繰返す(S8)。
図3は第1の文字コード体系と第2の文字コード体系属する文字の包含関係を示す図である。図3において、 は第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字との共通文字の集合を示す。また と を合わせたものは第1の文字コード体系の標準コード文字の集合を示す。また と を合わせたものは第1の文字コード体系の標準コード文字の集合を示す。したがって、 と を合わせたものは第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字との非共通文字の集合を示す。また、 は第1の文字コード体系の標準コード文字と、第2の文字コード体系のいずれでもない文字の集合を示す。また、第1の文字コード体系の外字は と に含まれ、第2の文字コード体系の外字は と に含まれる。
本発明において、標準コード変換テーブルは図3における の文字の文字コードのテーブルであり、第1の変換テーブルは図3における と を合わせたものの文字の文字コードのテーブルであり、第2の変換テーブルは図3における の文字の文字コードのテーブルである。なお文字コードの変換が第1の文字コード体系から第2の文字コード体系へと一方方向に常に行われる場合には、第1の変換テーブルは図3における の文字の文字コードのテーブルであってもよい( を省略することができる)。また第1の文字コード体系と第2の文字コード体系において、一方の標準コード文字が他方の標準コード文字を全て包含する場合には(そういう場合が多いが)包含関係によって または のいずれかは無集合となる。
図4は第1の文字コード体系と第2の文字コード体系属する文字の包含関係を棒グラフで示す図である。図4において、テキストデータの配給側の文字コード体系(第1の文字コード体系)はJEFであり、受領側の文字コード体系(第2の文字コード体系)はSJISである。図4に示すようにJEFの標準コード文字はSJISの標準コード文字を完全に包含しているから、この場合はSJIS標準コード文字の部分が標準コード変換テーブルを記述し、それら(JEFとSJIS)の差の部分(図3の )が第1変換テーブルを記述する文字コードの部分である。また、JEFの標準コード文字に含まれていない文字(外字)が第2の変換テーブルを記述する部分である。A社とB社のテキストデータの場合を示しているが、第2の変換テーブルは完全な外字であるから同じ文字であっても、A社とB社とでは異なる文字コードが普通与えられる。したがって、第2の変換テーブルは、テキストデータの配給側に応じて、会社単位、部門単位、品目単位、注番単位等で、別々に作成すると、再利用やメンテナンス等が容易となる。
図5は文字コード検証システムにおける処理の過程を示すフロー図である。図5において文字コード検証システムについて説明する。まず、データストアシステム5から文字コード検証システム1の記憶手段12にテキストデータファイルが読込まれる(S101)。読込まれたテキストデータ14から文字コード(i)が演算手段13に読込まれる(S102)。
次に、検証処理ルーチン16によって文字コードの検証が行われる。文字コードの検証は、まず標準文字コード変換テーブルを参照して文字コード(i)が標準文字コード変換テーブルに登録されているか否かが判定され、登録されている場合には所定の処理“a”が行われる(S103)。標準文字コード変換テーブルに登録されていない場合は、第1の変換テーブルを参照して文字コード(i)が第1の変換テーブルに登録されているか否かが判定され、登録されている場合には所定の処理“b”が行われる(S104)。第1の変換テーブルに登録されていない場合は、第2の変換テーブルを参照して文字コード(i)が第1の変換テーブルに登録されているか否かが判定され、登録されている場合には所定の処理“c”が行われる。そして第2の変換テーブルに登録されていない場合は所定の処理“d”が行われる(S105)。上述における所定の処理“a”“b”“c”“d”は本発明においては任意の処理であって、如何なるものでもよい。
次に、iがi+1に更新され(S106)、iが終了値である場合には処理を終了し、そうでない場合にはS102に戻って上述の処理を繰り返す(S107)。なお変換テーブルは、テキストデータ読込み過程(S101)において、テキストデータを指定した際に、そのテキストデータの文字コード体系や、そのテキストデータに属する第2の変換テーブルが特定できるから、必要な変換テーブルを、データストアシステムから同時に読込むようにすることができる。
図6は文字コード変換システムにおける処理の過程を示すフロー図である。図6において文字コード変換システムについて説明する。まず、データストアシステム5から文字コード変換システム2の記憶手段17にテキストデータファイルが読込まれる(S201)。読込まれたテキストデータ19から文字コード(i)が演算手段18に読込まれる(S202)。
次に、変換処理ルーチン21によって文字コードの変換が行われる。文字コードの変換は、まず標準文字コード変換テーブルを参照して文字コード(i)が標準文字コード変換テーブルに登録されている場合にはそのテーブルで変換処理が行われ、さらに所定の処理“A”が行われる(S203)。標準文字コード変換テーブルに登録されていない場合は、第1の変換テーブルを参照して文字コード(i)が第1の変換テーブルに登録されている場合にはそのテーブルで変換処理が行われ、さらに所定の処理“B”が行われる(S204)。第1の変換テーブルに登録されていない場合は、第2の変換テーブルを参照して文字コード(i)が第1の変換テーブルに登録されている場合にはそのテーブルで変換処理が行われ、さらに所定の処理“C”が行われる。そして第2の変換テーブルに登録されていない場合は所定の処理“D”が行われる(S205)。上述における所定の処理“A”“B”“C”“D”は本発明においては任意の処理であって、如何なるものでもよく限定されないが、たとえば、変換済のテキストデータファイルを生成する(“A”“B”“C”)、あるいは、変換不可の文字コードとその位置(たとえば“i”)からなるデータファイルを生成する(“D”)等の処理が行われる。
次に、iがi+1に更新され(S206)、iが終了値である場合には処理を終了し、そうでない場合にはS202に戻って上述の処理を繰り返す(S107)。なお変換テーブルは、テキストデータ読込み過程(S201)において、テキストデータを指定した際に、そのテキストデータの文字コード体系や、そのテキストデータに属する第2の変換テーブルが特定できるから、必要な変換テーブルを、データストアシステムから同時に読込むようにすることができる。また、上述の例では変換テーブルの参照を各サブ変換テーブルを参照して3回に分けたが、“A”“B”“C”の処理を異なったものとする必要がない場合には、図2で説明したように、変換テーブルの領域の全てを1度に参照して1回で行うこともできる。
図7は文字コード登録システムにおける処理の過程を示すフロー図である。図7において文字コード登録システムについて説明する。まず、データストアシステム5から文字コード登録システム3の記憶手段22にテキストデータファイルが読込まれる(S301)。読込まれたテキストデータ24から文字コード(i)が演算手段23に読込まれる(S302)。
次に、登録処理ルーチン27によって文字コードの登録が行われる。文字コードの登録は、まず標準文字コード変換テーブルおよび第1の変換テーブルを参照して文字コード(i)が標準文字コード変換テーブルまたは第1の変換テーブルに登録されているか否かが判定され、登録されている場合には第1の管理テーブルに変換された文字コードの登録が行われる(図示せず)。標準文字コード変換テーブルまたは第1の変換テーブルに登録されていない場合は(この場合文字コード(i)は外字コードであるから、以降外字コード(i)とする)第2の変換テーブルを参照し、第1の(変換前の)文字コード体系の外字コードが登録されており、かつ、第2の(変換後の)文字コード体系の外字コードが登録されている場合は、第2の変換テーブルに基づいて外字コード(i)を変換し、変換後の外字コードを第2の管理テーブルに登録する(S303)。
また、第1の文字コード体系の外字コードが登録されており、かつ、第2の文字コード体系の外字コードが登録されていない場合は、第1の文字コード体系の外字コードを第1の管理テーブルに登録し、さらに、第2の文字コード体系の文字コードとして任意に定めた文字コードを第2の管理テーブルに登録する(S304)。また、第1の文字コード体系の外字コードが登録されておらず、かつ、第2の文字コード体系の外字コードが登録されていない場合は、第1の文字コード体系の外字コードを第2の変換テーブルに登録し、また第1の管理テーブルに登録し、さらに、第2の文字コード体系の外字コードとして任意に定めた文字コードを第2の管理テーブルに登録する(S305)。
次に、iがi+1に更新され(S306)、iが終了値である場合には処理を終了し、そうでない場合にはS302に戻って上述の処理を繰り返す(S307)。なお変換テーブルは、テキストデータ読込み過程(S301)において、テキストデータを指定した際に、そのテキストデータの文字コード体系や、そのテキストデータに属する第2の変換テーブルが特定できるから、必要な変換テーブルを、データストアシステムから同時に読込むようにすることができる。
図8は第1の変換テーブルの一例を表として示す図である。図8において、“漢字コード体系”の欄には第1の文字コード体系の名称、すなわち、変換前の文字コード体系の名称、配給側システムの文字コード体系、入稿先の文字コード体系の名称が記載されている。“漢字コード”の欄には、第1の文字コード体系の文字コードが記載されている。また、“受領側漢字コード”の欄には、第1の文字コード体系の文字コードに対応する第2の文字コード体系のコードが記載されている。この第1の変換テーブルは、データベースのリレーションとして記述される。リレーション名は“第1の変換テーブル”であり、その属性名は“漢字コード体系”“漢字コード”“受領側漢字コード”である。そして、“JEF”や“78JIS”は“漢字コード体系”の要素であり、“B0F1”や“B1B3”は“漢字コード”の要素であり、“F640”や“F641”は“受領側漢字コード”の要素である。
図9は第2の変換テーブルの一例を表として示す図である。図9において、“入稿先ID”の欄には入稿先の名称、すなわち、A社、B社、部門、品目、注番等の名称が記載されている。“入稿先文字コード”の欄には、第1の文字コード体系の文字コードが記載されている。また、“受領側文字コード”の欄には、第1の文字コード体系の文字コードに対応する第2の文字コード体系のコードが記載されている。図9中の“(?)”は、抽出したが未登録であること、すなわち、前述した文字コード登録処理におけるS304の処理(図7参照)が行われた結果が記載されている。この第2の変換テーブルは、データベースのリレーションとして記述される。リレーション名は“第2の変換テーブル”であり、その属性名は“入稿先ID”“入稿先文字コード”“受領側文字コード”である。そして、“A”や“B”は“入稿先ID”の要素であり、“80A1”や“81A2”は“入稿先文字コード”の要素であり、“F043”や“F150”は“受領側文字コード”の要素である。
図10は第1の管理テーブルの一例を表として示す図である。図10において、“入稿先ID”の欄には入稿先の名称、すなわち、A社、B社、部門、品目、注番等の名称が記載されている。“発生レコードNo.”の欄には、第1の文字コード体系の文字コード(i)のテキストデータ内の位置、この場合は、レコード番号が記載されている。また、“フィールドNo.”の欄には、第1の文字コード体系の文字コード(i)のレコード内の位置、この場合は、フィールド番号が記載されている。また、“外字位置”の欄には、第1の文字コード体系の文字コード(i)のフィールド内の位置、この場合は、先頭からのデータバイト数が記載されている。また、“未登録入稿文字コード”の欄には、第1の文字コード体系の文字コード(i)の文字コードで、1文字のデータが記載されている。前述の文字コード登録処理(図7参照)において文字コードの登録は、1文字づつ登録してもよく、フィールド単位で文字列として登録してもよい。図10に示すように、この場合は文字列として登録するよりは1文字のデータで登録するほうが、データの後処理、第2の変換テーブルに新規登録する等においてデータ形式の整合性がよくなる。
このように第1の管理テーブルは、テキストデータ中の未登録の外字の文字コードをテキストデータ内の位置データとともに記録したものであり、図10に示しように“外字ロケーション管理テーブル”とも呼ぶべき管理テーブルである。この“外字ロケーション管理テーブル”への登録は、前述したように、文字コード登録処理(図7参照)における第1の管理テーブルに登録する処理過程(S304,S305)によって登録されたものである。この第1の管理テーブルは、データベースのリレーションとして記述される。リレーション名は“第1の管理テーブル”もしくは“テキストデータ管理テーブル”であり、その属性名は“入稿先ID”“発生レコードNo.”“フィールドNo.”“外字位置”“未登録入稿文字コード”である。そして、“A”は“入稿先ID”の要素であり、“1”“41”は“発生レコードNo.”の要素であり、“2”は“フィールドNo.”の要素であり、“9”“1”は“外字位置”の要素であり、“80A3”“80A4”は“未登録入稿文字コード”の要素である。なお、位置データとして“発生レコードNo.”等を登録する例を示したが、レコードに限定されず、外字データの位置を特定する他のデータ、例えば社員番号であってもよい。
図11は第2の管理テーブルの一例を表として示す図である。図11において、“入稿先ID”の欄には入稿先の名称、すなわち、A社、B社、部門、品目、注番等の名称が記載されている。“発生レコードNo.”の欄には、第1の文字コード体系の文字コード(i)のテキストデータ内の位置、この場合は、レコード番号が記載されている。また、“フィールドNo.”の欄には、第1の文字コード体系の文字コード(i)のレコード内の位置、この場合は、フィールド番号が記載されている。また、“文字データ(受領側文字コード)”の欄には、第1の文字コード体系の文字コード(i)を第2の文字コード体系の文字コードに変換した文字コードで、1フィールドに属する文字列のデータが記載されている。前述の文字コード登録処理(図7参照)において文字コードの登録は、1文字づつ登録してもよいが、フィールド単位で文字列として登録してもよい。図11に示すようにフィールド単位で文字列として登録することにより、データの後処理、たとえばプリントイメージデータの作成等においてデータ形式の整合性がよくなる。
このように第2の管理テーブルは、テキストデータを文字コード変換したデータをテキストデータ内の位置データとともに記録したものであり、図11に示しように“テキストデータ管理テーブル”とも呼ぶべき管理テーブルである。図11中において、“文字データ(受領側文字コード)”の欄の“■”は未登録文字コードを“■”に変換したことを示している。すなわち、前述の文字コード登録処理(図7参照)における任意に定めた文字コードを第1の管理テーブルに登録する処理過程(S304,S305)によって登録されたものである。この第2の管理テーブルは、データベースのリレーションとして記述される。リレーション名は“第2の管理テーブル”もしくは“テキストデータ管理テーブル”であり、その属性名は“入稿先ID”“発生レコードNo.”“フィールドNo.”“文字データ(受領側文字コード)”である。そして、“A”は“入稿先ID”の要素であり、“1”は“発生レコードNo.”の要素であり、“1”“2”“3”は“フィールドNo.”の要素であり、や“1001”“大日本■太郎”“営業部”は“文字データ(受領側文字コード)”の要素である。なお、必要に応じてその他の属性として、文字データのデータタイプ(1バイト系、2バイト系または混在)、文字数等を加えてもよい。
次に、本発明のシステムの好適な適用例である個人情報発行システムについて説明する。図12は個人情報発行システムの全体構成の主として入力側を示す図(ページ1/2)である。また図13は個人情報発行システムの全体構成の主として出力側を示す図(ページ2/2)である。図12および図13において、101はデータベース管理手段、102はイーサネット等のLAN(LocalAreaNetwork)、103は入稿仕様登録手段、104はカード印字レイアウト登録手段、105はテキスト入稿手段、106は画像入稿手段、107は帳票印字レイアウト登録手段、108はディジタル出力仕様登録手段、109は発行指示手段、110は生産管理手段、111は抽出手段、112はカード出力手段、113は帳票出力手段、114はディジタルメディア出力手段である。図12および図13に示すように、データベース管理手段101は画像データ、文字データ、レイアウトデータ、入稿情報、発行指示情報、出力情報、生産管理情報をデータベースとして保存し管理する。またデータベース管理手段101はLAN102に接続されており、LAN102を介してLAN102に接続され他の端末とデータの相互転送を行うことができる。図のシステム構成においては、データベース管理手段101はサーバーとして、その他の登録、入力、出力手段はクライアントとして位置付けられている。各手段はパーソナルコンピュータ、ワークステーション等のコンピュータの本体とディスプレイ、キーボードから構成されている。画像入力手段、カード出力手段、帳票出力手段等はそれぞれ専用の入出力装置を有する。
入稿仕様登録手段103は、入稿先のユーザ毎に登録、管理する。まず、テキストデータ入稿仕様の登録の場合、入稿される媒体の種類やフォーマット、漢字コード体系等の基本属性と、ファイル内の社員番号や氏名、住所等の入稿ファイルレイアウト情報を登録する。その際、既にカード印字レイアウト仕様等の出力仕様が登録されている場合、それらの必要な項目を全て入稿できるよう、出力仕様を参照しながら入稿情報が登録される。図14はユーザ入稿テキストデータのレコードレイアウトの一例を示す図である。図14においてフィールド〔A〕は社員ID(Identification)番号が3桁(3バイト)で記録され、フィールド〔B〕は氏名が10桁(20バイト)で、フィールド〔C〕は所属名が20桁(40バイト)で記録されていることを示している。
図15はアイテム仕様の登録画面の一例であり得意先テキストデータの仕様を登録する画面を示す図である。図15に示すようにユーザテキストデータのレコードは社員番号、氏名、有効期限、所属の4つのフィールドから構成されている。そして社員番号はレコードの1バイト目から6バイト目までタイプ1(数字)で6バイト記録されており、氏名はレコードの7バイト目から22バイト目までタイプ3(2バイト文字)で16バイト記録されており、有効期限はレコードの23バイト目から27バイト目までタイプ1(数字)で5バイト記録されており、所属はレコードの28バイト目から31バイト目までタイプ1(数字)で4バイト記録されている。
画像データ入稿仕様についても同様に、入稿される媒体の種類やフォーマット(ディジタル画像のフォーマットや写真や絵などの紙面データも含む)等の基本属性と、入稿サイズを登録する。その際も、既にカード印字レイアウト仕様等の出力仕様が登録されている場合、それらを基準とした必要かつ十分なサイズで取り込めるように、登録することが可能である。それによって、ハードディスク等の保存資産を有効に使え、また出力時の拡大処理による品質劣化を防ぐことができる。図16は出力仕様を参照して画像データを入稿する過程を模式的に示す図である。図16において、カード印字仕様では天地:100dot、左右:100dot、またディジタルメディア出力仕様では天地:50dot、左右:50dotであるので、画像データ入稿仕様では天地:100dot、左右:100dotとして入稿すれば品質上は十分であり、これ以上の画素密度でデータを入稿する必要はない。
図17はアイテム仕様の登録画面の一例であり得意先画像データの仕様を登録する画面を示す図である。図17に示すように画像の種類は“Q”〜“Y”までの9種類を登録することができ、この場合は1種類のみ登録されている。得意先が入稿する媒体は“01"の写真であり、その写真をディジタルデータとして保存する画像ファイルの媒体は“02”のMO(光磁気ディスク)である。また“TagF”は・・・・・・を意味し、“基準1”は・・・・・・を意味し、画像データのサイズは(天地372画素)×(左右278画素)である。図17に示すように出力仕様の画像サイズが表示されており、この表示を参考にして登録を行うことができる。
カード印字レイアウト登録手段104と帳票レイアウト登録手段7は、入稿されるユーザデータの社員番号や氏名、住所等の項目ごとの印字位置、文字サイズ、印字フォント等が登録される。また、印字形態が文字だけでなくバーコードや磁気記録部エンコード等の機械読取り可能なデータが出力される場合には、その出力データを構成するユーザデータの項目や、印字サイズ、フォーマット等を登録する。図18は項目ごとの印字位置、印字フォント、文字サイズの登録状況を表として示す図である。
ディジタルメディア出力仕様登録手段8は、入稿仕様登録手段と内容的には同じで、出力する媒体に必要なユーザデータの項目とその属性を記録する。対象となる項目は文字データでも画像データでもよい。画像の場合は、データベース上でJPEG等の方式で圧縮されている場合などにおいて出力フォーマットがそれと異なる場合には、解凍した後登録されているフォーマットに変換し、所定の媒体にデータを作成する。
テキスト入稿手段では、ユーザごとに入稿仕様登録手段で登録された仕様に基づき、テキストデータをデータベース上の標準コード体系に変換するために、文字コードおよび漢字コード体系に変換する。その際に発生するユーザ固有の外字コードを抽出し、文字データと同様にユーザ外字コードをデータベースに登録する。また、抽出したユーザ外字コードに対して、データベース上で一元的に管理している標準外字コード体系のコードをユーザ外字に対して割り当てる。この対応を、データベースに登録しておけば、初回テキスト入稿時以降同一のユーザ外字は自動外字コードに変換される。
また、入稿されるテキスト中で画像データとのマッチングをとるためのユニークとなる項目で、データベース上に既に登録されているレコードを検索し、入稿テキストデータが新規かあるいは、更新データかをチェックした後その処理を指示し、データベース管理手段に登録する。入稿されるテキストデータは、フロッピーディスク(FD)や光磁気ディスク(MO)等の携帯メディアでもオンラインネットワークから転送されるファイルでも構わない。
この時、レイアウト情報登録手段で出力レイアウト仕様を、複数のレイアウトパターンで出力可能なようにフラグ対応とした場合、レイアウト情報入力手段でレイアウトのフラグ情報を、ユーザデータからテキスト入力手段と同様の方法で文字データを取得し、これを出力レイアウトの仕様として、データベース管理手段に登録する。この機能によって、ユーザデータのレコードごとに多様な出力仕様を持たせることができる。たとえば、先の例で社員IDの下一桁が何であるかによってカードの印字仕様を変えるには、“0”〜“9”までの10パターンのカード印字仕様を登録しておき、入稿仕様にユーザ入稿テキストの〔A〕フィールドの3バイト目にカード印字レイアウトのフラグ情報があることを登録しておく。これによって、テキストを入稿すると同時にユーザデータのレコードごとにカード印字仕様が、自動的にデータベースに登録される。
画像入稿手段106も、テキスト入稿手段と同様ユーザごとに入稿仕様登録手段で登録された仕様をもとに、入稿する画像のサイズにトリミングまたは拡大縮小しデータベースに登録する。フロッピーディスク(FD)や光磁気ディスク(MO)等のディジタル画像データでは、その画像データのフォーマットをデータベースで登録管理している標準フォーマットに変換した後登録する。また、テキスト同様に入稿時にそのデータが、新規かあるいは、更新データかをチェックした後その処理を指示し、データベース管理手段に登録する。
発行指示手段9では、ユーザの入稿されたデータの内、どのデータを、どの順で、どの媒体に出力するかを登録する。この手段では、すでに入稿されているテキストデータや画像データをもとに、発行指示データも作成することが可能である。また、テキストデータや画像データとは別に第3のデータとして、発行序列データを入稿することも可能である。図19は発行序列データを参照して文字データが利用されることが表として示されている。
抽出手段111では、ユーザごとに登録されている発行指示データをもとに、出力先の出力仕様に基づいて、文字データや画像データを検索し、入稿データに不足がないか否かをチェックする。その後、指示されている出力先に対し、文字データや画像データの抽出処理を行い、出力装置ごとに定められたファイル等の中間データを生成する。カードなどの出力手段では、抽出済みの中間データをもとに出力装置に対して出力処理を実行する。その際、生産管理情報として、出力履歴をデータベース管理手段に登録する。また抽出手段と出力手段を一つの手段として組み合わせてもよいが、処理を分散化させ、作業の平準化を図るためには前述のように手段を分けるほうが好ましい。
以上で個人情報記録媒体発行システムの構成と動作の説明を終え、次に個人情報記録媒体を発行する処理過程について説明する。図20は上記システムにおいて個人情報記録媒体を発行する処理過程を示すフロー図である。図20において、まずアイテム仕様の登録が行われる。アイテム仕様の登録は、入稿される文字データと画像データの仕様である入稿仕様を登録する入稿仕様登録手段103、カード上に印字するためのカード印字レイアウト情報を入力するカード印字レイアウト登録手段104、写真台紙等に印字するための帳票印字レイアウト情報を入力する帳票印字レイアウト登録手段107、ディジタルメディアに加工するためのディジタル出力レイアウト情報を入力するディジタル出力レイアウト登録手段108、等によって行われ、データベース管理手段1によってデータベースの入稿情報あるいはレイアウトデータとして格納される(S401)。
次にテキストデータがテキスト人稿手段5から入稿され、データベース管理手段101によってデータベースの文字データとして格納される(S402)。そして発行指示手段109において発行指示データが作成され、データベース管理手段101によってデータベースの発行指示情報として格納され(S403)、発行指示情報と出力レイアウト情報に基づいて抽出手段111によって必要な文字データが抽出され、データベース管理手段101によってデータベースの出力情報として格納される(S404)。そして、その出力情報に基づいて帳票出力手段114によって写真台紙ヘの印字出力が行われ(S405)。図21は写真台紙の一例を示す図である。図21において、SEQ.NO.(通し番号)、氏名(大日本花子)、社員番号の文字、社員番号のバーコード、および顔写真を貼る位置が示されている。顔写真は得意先において貼りつけられるものであって、写真台紙への印字出力が行われたステップにおいては貼られていない。
次に顔写真が貼りつけられて得意先から返却された写真台紙から画像入稿手段106によって画像データが入稿され、データベース管理手段101によってデータベースの画像データとして格納される(S406)。以上のステップによって出力に必要な全てのデータが揃うことになるが、たとえば得意先から返却された写真台紙に不足が生じている等によりデータが不足している場合もある。
次に出力選択が行われ(S407)、IDカードを発行するのであれば、抽出手段11によって、まず出力先の出力仕様に基づいて文字データや画像データを検索し入稿データに不足がないか否か整合性をチェックする。不足がある場合には、その旨がファイル等に出力されるとともに不足があるデータは出力処理を行わないようにする。その後、指示されている出力先に対し、必要な文字データと画像データが抽出され、データベース管理手段1によってデータベースの出力情報として格納され(S408)、その出力情報に基づきIDカード出力手段12によってIDカードの発行が行われる。出力情報は整合性のチェック済みであるから機械停止等の阻害がなくスムーズに出力処理が行われる(S409)。出力処理を終了する場合は処理を終了とし、継続するのであればS407に戻る(S410)。
同様に、ディジタルメディアを発行するのであれば、抽出手段111によって整合性をチェック後に必要な文字データと画像データが抽出され、データベース管理手段101によってデータベースの出力情報として格納され(S411)、その出力情報に基づきデジタル出力手段14によってディジタルメディアの発行が行われる(S412)。出力処理を終了する場合は処理を終了とし、継続するのであればS407に戻る(S410)。また郵送台紙を発行するのであれば、抽出手段111によって整合性をチェック後に必要な文字データと画像データが抽出され、データベース管理手段101によってデータベースの出力情報として格納され(S413)、その出力情報に基づき帳票出力手段113によって郵送台紙の発行が行われる(S414)。出力処理を終了する場合は処理を終了とし、継続するのであればS407に戻る(S410)。
本発明のシステムの構成を示す図である。 本発明の文字コード変換システムとともに協調して利用される文字コード検証システム、文字コード登録システムを組合わせたシステムにより行われるテキストデータ受領処理の処理過程を示すフローチャートである。 第1の文字コード体系と第2の文字コード体系属する文字の包含関係を示す図である。 第1の文字コード体系と第2の文字コード体系属する文字の包含関係を棒グラフで示す図である。 文字コード検証システムにおける処理の過程を示すフロー図である。 文字コード変換システムにおける処理の過程を示すフロー図である。 文字コード登録システムにおける処理の過程を示すフロー図である。 第1の変換テーブルの一例を表として示す図である。 第2の変換テーブルの一例を表として示す図である。 第1の管理テーブルの一例を表として示す図である。 第2の管理テーブルの一例を表として示す図である。 個人情報発行システムの全体構成の主として入力側を示す図(ページ1/2)である。 個人情報発行システムの全体構成の主として出力側を示す図(ページ2/2)である。 ユーザ入稿テキストデータのレコードレイアウトの一例を示す図である。 アイテム仕様の登録画面の一例であり得意先テキストデータの仕様を登録する画面を示す図である。 出力仕様を参照して画像データを入稿する過程を模式的に示す図である。 アイテム仕様の登録画面の一例であり得意先画像データの仕様を登録する画面を示す図である。 項目ごとの印字位置、印字フォント、文字サイズの登録状況を表として示す図である。 発行序列データを参照して文字データが利用されることが表として示されている。 個人情報記録媒体を発行する処理過程を示すフロー図である。 写真台紙の一例を示す図である。
符号の説明
1 文字コード検証システム
2 文字コード変換システム
3 文字コード登録システム
4,102,102’LAN
5 データストアシステム
6,8,10 入力手段
7,9,11 出力手段
12,17,22 記憶手段
13,18,23 演算手段
14,19,24 テキストデータ
15,20.25 変換テーブル
16 検証処理ルーチン
21 変換処理ルーチン
26 管理テーブル
27 登録処理ルーチン
101 データベース管理手段
103 入稿仕様登録手段
104 カード印字レイアウト登録手段
105 テキスト入稿手段
106 画像入稿手段
107 帳票印字レイアウト登録手段
108 ディジタル出力仕様登録手段
109 発行指示手段
110 生産管理手段
111 抽出手段
112 カード出力手段
113 帳票出力手段
114 ディジタルメディア出力手段

Claims (1)

  1. 所定の文字コードを複数の変換テーブルの内で前記所定の文字コードが登録されている変換テーブルを使用し変換処理する文字コード変換システムであって、
    前記変換テーブルは、標準コード変換テーブルと、第1の変換テーブルと、第2の変換テーブルと、から成り、前記標準コード変換テーブルには、第1の文字コード体系の標準コード文字と、第2の文字コード体系の標準コード文字と、の共通文字の文字コードを変換するデータが記述され、 前記第1の変換テーブルには、前記第1の文字コード体系の標準コード文字と、前記第2の文字コード体系の標準コード文字と、の非共通文字の文字コードを前記第1または前記第2の各文字コード体系の各外字コードに変換するデータが記述され、 前記第2の変換テーブルには、前記第1の文字コード体系の標準コード文字と、前記第2の文字コード体系の標準コード文字と、のいずれでもない文字コードを、前記第1または前記第2の各文字コード体系の各外字コードに変換するデータが記述されている、 ことを特徴とする文字コード変換システム。

JP2005060822A 2005-03-04 2005-03-04 文字コード変換システム Pending JP2005196806A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005060822A JP2005196806A (ja) 2005-03-04 2005-03-04 文字コード変換システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005060822A JP2005196806A (ja) 2005-03-04 2005-03-04 文字コード変換システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP7200322A Division JPH0934887A (ja) 1995-07-14 1995-07-14 文字コード検証、変換、および登録システム

Publications (1)

Publication Number Publication Date
JP2005196806A true JP2005196806A (ja) 2005-07-21

Family

ID=34824809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005060822A Pending JP2005196806A (ja) 2005-03-04 2005-03-04 文字コード変換システム

Country Status (1)

Country Link
JP (1) JP2005196806A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012216106A (ja) * 2011-04-01 2012-11-08 Seiko Epson Corp 記録制御装置、記録システム、記録制御方法、及び、プログラム
CN111857678A (zh) * 2019-04-25 2020-10-30 阿里巴巴集团控股有限公司 代码生成方法、装置、电子设备及计算机存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012216106A (ja) * 2011-04-01 2012-11-08 Seiko Epson Corp 記録制御装置、記録システム、記録制御方法、及び、プログラム
CN111857678A (zh) * 2019-04-25 2020-10-30 阿里巴巴集团控股有限公司 代码生成方法、装置、电子设备及计算机存储介质
CN111857678B (zh) * 2019-04-25 2024-05-31 阿里巴巴(中国)有限公司 代码生成方法、装置、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US5870712A (en) Data processing method and its apparatus
JP2009181438A (ja) データ処理装置及びプログラム
JP2005196806A (ja) 文字コード変換システム
CN111597786A (zh) 一种通过文件导入生成电子证照的实现方法及系统
CN101706910A (zh) 一种支持库存事务及记账规则配置的方法
JP2002073652A (ja) 記録情報処理方法
JP3868537B2 (ja) 個人識別媒体発行システム及びデータチェック方法
JP2005196807A (ja) 文字コード登録システム
CN108563616A (zh) 一种船舶电子底图管理方法
JPH0934887A (ja) 文字コード検証、変換、および登録システム
JPH08315034A (ja) 個人情報記録媒体発行システム
JP3369306B2 (ja) 個人情報記録媒体を発行するシステムに個人情報を配給する装置
JPH0944482A (ja) テキストデータ配給システムおよび受領システム
JP4329896B2 (ja) 固定資産管理装置、固定資産管理システム、プログラム、及び記録媒体
JP2010198403A (ja) バリアブルpdf編集システム
JPH11259602A (ja) カード発行システム
JPH09160912A (ja) 図形文字データベース管理システムおよび個人情報記録媒体発行システム
JP2905527B2 (ja) 電子媒体による出願依頼受付システム
JP2008102858A (ja) 情報処理装置及びプログラム
JP6893839B2 (ja) 図面管理システム、図面管理システムの制御方法及びプログラム
JP4328174B2 (ja) 伝票管理装置
JPH0934773A (ja) データベース管理システム
JPH0728796A (ja) 名刺作成装置
JP2000107701A (ja) 媒体送付データ作成システム及び送付物
JP2001143058A (ja) イメージ情報文書化システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070529