JP3402971B2 - 文字化け検査方法及び文字化け検査用データ作成装置 - Google Patents

文字化け検査方法及び文字化け検査用データ作成装置

Info

Publication number
JP3402971B2
JP3402971B2 JP31514596A JP31514596A JP3402971B2 JP 3402971 B2 JP3402971 B2 JP 3402971B2 JP 31514596 A JP31514596 A JP 31514596A JP 31514596 A JP31514596 A JP 31514596A JP 3402971 B2 JP3402971 B2 JP 3402971B2
Authority
JP
Japan
Prior art keywords
character
data
garbled
information processing
processing environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31514596A
Other languages
English (en)
Other versions
JPH10161825A (ja
Inventor
英樹 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Screen Holdings Co Ltd
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd, Dainippon Screen Manufacturing Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP31514596A priority Critical patent/JP3402971B2/ja
Publication of JPH10161825A publication Critical patent/JPH10161825A/ja
Application granted granted Critical
Publication of JP3402971B2 publication Critical patent/JP3402971B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Record Information Processing For Printing (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ある情報処理環境
で作成した文書を別の情報処理環境で印刷したときの文
字化けを検査する方法に関する。
【0002】
【従来の技術】一般に印刷物は、企画、原稿作成、編
集、組版、印刷の工程を経て作成される。近年、編集以
降の工程は電子化が進み、例えばDTP(デスクトップ
・パブリッシング)システムなどの形で具現化され、広
く利用されている。
【0003】また、コンピュータからプリンタへ転送す
る印刷データのフォーマットとして、ページ記述言語
(以下、PDLという)が普及している。PDLは、プ
リンタの能力(解像度など)に依存しない形で各ページ
の印刷イメージを記述することができ、プリンタは、P
DLで記述されたイメージを自らの解像度などに応じて
印刷する。コンピュータ側では、文書編集ソフトウエア
などにて文書を作成し、印刷の際にその文書のデータか
らPDLデータを生成してプリンタに送信する。プリン
タは、PDLの解釈機構を有しており、PDLデータを
解釈してメモリ上に各ページのラスタイメージを生成
し、そのラスタイメージに従って紙などに印刷を行う。
近年では、PostScript(米国AdobeSy
stems社の商標)がPDLの事実上の標準として広
く普及しており、個人用から業務用まで、様々な種類の
PostScript対応の印刷装置が発売されてい
る。
【0004】このような状況のもと、顧客から文書のデ
ータをPostScriptなどのPDLの形で受けと
り印刷処理を代行するサービスが登場している。また印
刷業界においても、原稿の内容を電子的に編集する業者
と、この業者から文書をPDLデータの形で受けとって
タイプセッターに出力するいわゆる「出力センター」な
る業者との分業化が進んでいる。このように、近年で
は、文書を、作成した環境とは別の環境で印刷する場合
が増えてきている。
【0005】ところが、文書作成側の環境にあるフォン
トが印刷側の環境にない場合や、あるいは文書作成側と
印刷側とで外字等の文字コードが一致しない場合などが
往々にしてあり、このような場合には、文書作成側が意
図した文字が印刷側で正しく印刷されず、いわゆる文字
化けが生じることがあった。このため、従来は、印刷側
で出力した印刷結果と元の原稿とをつき合わせて、すべ
ての文字が文書作成者の意図どおりに印刷されているか
をチェックしていた。
【0006】
【発明が解決しようとする課題】しかしながら、このよ
うなチェック作業に要する時間や労力は膨大なものであ
り、省力化の方策が求められていた。
【0007】本発明は、このような問題を解決するため
になされたものであり、文書を、その文書を作成した環
境とは別の環境で印刷する場合における、文字化けの検
査を省力化するための方法及び装置を提供することを目
的とする。
【0008】
【課題を解決するための手段】前述の目的を達成するた
めに、本発明に係る文字化け検査方法は、第1の情報処
理環境で作成した文書を第2の情報処理環境で印刷する
際の文字化けを検査する方法であって、前記第1の情報
処理環境にて、作成した文書に含まれる互いに異なる文
字種を抽出して検査用データを作成し、この検査用デー
タを印刷し、前記検査用データ及びその印刷結果を前記
第2の情報処理環境に伝達し、前記第2の情報処理環境
にて、伝達された前記検査用データを印刷し、この印刷
結果を前記第1の情報処理環境における印刷結果と比較
することにより文字化けを検査することを特徴とする。
【0009】この構成において、文字種とは、文字コー
ドやフォントなどによって特定される個々の「文字」の
ことである。この構成では、文書を作成した第1の情報
処理環境にて、文書から互いに異なる文字種のみを抽出
して検査用データを作成する。この検査用データの第1
の情報処理環境での印刷結果を、文書を印刷する第2の
情報処理環境での当該検査用データの印刷結果と比較す
ることにより、両環境間での文字化けを検出する。この
構成によれば、文書中の重複した文字が省かれたものが
検査用データとなるので、検査用データのサイズ、すな
わち文字数は、元の文書に比べて極めて小さいものとな
る。従って、この構成によれば、文書の全文をつき合わ
せる場合よりもはるかに少ない時間・労力で文字化けを
チェックすることができる。
【0010】また、本発明は、第1の情報処理環境に
て、作成した文書から文字化けの可能性が高い文字種の
みを抽出して検査用データを作成し、この検査用データ
を印刷し、前記検査用データ及びその印刷結果を第2の
情報処理環境に伝達し、第2の情報処理環境にて、伝達
された前記検査用データを印刷し、この印刷結果を前記
第1の情報処理環境における印刷結果と比較することに
より文字化けを検査することを特徴とする。
【0011】この構成では、作成した文書に含まれる全
文字種を文字化け検査の対象とせずに、あらかじめ定め
られた検査対象文字種に該当する文字種のみを文字化け
検査の対象とする。すなわち、例えばJISの第1水準
などの文字は、標準化されており文字化けの可能性は極
めて低い。このような文字化けの可能性が低い文字種を
除いた文字化けの可能性の高い文字種のみを検査対象文
字種とし、この検査対象文字種に該当するもののみを抽
出することにより、検査用データのサイズをさらに小さ
くすることができ、効率よく文字化け検査を行うことが
できる。
【0012】また、前述の目的を達成するために、本発
明に係る文字化け検査用データ作成装置は、 第1の情
報処理環境で作成した検査用データを印刷した印刷物
と、該検査用データを第2の情報処理環境で印刷した印
刷物と、を比較することにより、前記第1の情報処理環
境で作成した文書を前記第2の情報処理環境で印刷する
際の文字化けを検査するために、前記検査用データを作
成する文字化け検査用データ作成装置であって、前記第
1の情報処理環境で作成した文書データに含まれる互い
に異なる文字種を抽出する文字種抽出手段と、前記抽出
した文字種のデータに基づき前記検査用データを成す
検査用データ成手段とを含むことを特徴とする。こ
の構成によれば、印刷対象の文書データに含まれるすべ
ての文字種を抽出し、検査用データを作成することがで
きる。
【0013】また、本発明に係る文字化け検査用データ
作成装置は、第1の情報処理環境で作成した検査用デー
タを印刷した印刷物と、該検査用データを第2の情報処
理環境で印刷した印刷物と、を比較することにより、前
記第1の情報処理環境で作成した文書を前記第2の情報
処理環境で印刷する際の文字化けを検査するために、前
記検査用データを作成する文字化け検査用データ作成装
置であって、文字化け検査対象文字種を特定するための
情報が登録された候補情報テーブルと、前記第1の情報
処理環境で作成した文書データから、前記候補情報テー
ブルの情報によって特定される文字化け検査対象文字種
に含まれる文字種を抽出する文字種抽出手段と、前記
出した文字種のデータに基づき前記検査用データを
する検査用データ成手段とを含むことを特徴とする。
この構成では、候補情報テーブルには、文字化けの検査
をすべき検査対象文字種を特定するための情報が登録さ
れる。文字種抽出手段は、この候補情報テーブルの情報
に基づき、印刷対象の文書データから検査対象に該当す
る文字種を抽出する。この構成によれば、印刷対象の文
書に含まれる文字のうち、検査対象のもののみを抽出し
て検査用データを生成することができる。
【0014】本発明の好適な態様では、検査用データ
成手段は、文字種抽出手段にて抽出した文字種をフォン
トごとに整理して配列することを特徴とする。この構成
によれば、検査用データにおいて、各文字種がフォント
ごとに整理して配列されるため、この検査用データの印
刷結果には、検査すべき各文字種がフォントごとに配列
して表示されるので、検査がしやすくなる。
【0015】さらに好適には、検査用データ成手段
は、各フォントごとに整理した文字種の配列に対し、当
該配列に対応するフォント名を表す文字列データを付加
する機能を有する。この構成によれば、検査用データの
印刷結果には、フォントごとの各文字種の配列に対して
当該配列に対応するフォント名が印刷されるので、文字
化けの検査においてフォント名の特定が容易となる。
【0016】また、本発明は、コンピュータを、印刷対
象の文書データに含まれるすべての文字種を抽出する手
段、抽出した文字種のデータに基づき検査用データを生
成する手段、として機能させるためのプログラムを記録
した記録媒体を提供する。
【0017】また、本発明は、コンピュータを、文字化
け検査の対象文字種が登録された候補情報テーブルに含
まれる文字種を印刷対象の文書データから抽出する手
段、抽出した文字種のデータに基づき検査用データを生
成する手段、として機能させるためのプログラムを記録
した記録媒体を提供する。
【0018】なお、前記記録媒体の概念には、フレキシ
ブルディスクなどの磁気媒体やCD−ROMや光磁気デ
ィスクなどの光学読取式媒体、ROMやフラッシュメモ
リなどの半導体記憶媒体など、プログラムを記録した機
械読取り可能なすべての媒体が含まれる。なお、上記プ
ログラムを通信媒体を経由して提供・記録する方法も本
発明の態様に含まれる。
【0019】
【発明の実施の形態】以下、本発明の好適な実施形態を
図面に基づいて説明する。まず、図1を用いて、本発明
に係る文字化け検査の全体的な処理手順を説明する。
【0020】図1に示す処理の前提として、文書作成側
の環境と印刷側の環境には、共通のPDL(例えばPo
stScript)を処理できる印刷装置が接続されて
いるものとする。文書作成側の印刷装置は、作成した文
書データの文字内容が文書の原稿と比較して誤りがない
ことを確かめるための装置であり、少なくとも文書で使
用されている全ての文字の出力が可能なCRT表示装置
やレーザプリンタ等の装置である。印刷側の印刷装置
は、最終生成物あるいはそれと等価な物を出力できる装
置であり、最終生成物が印刷紙の場合、校正用印刷物を
作成する校正装置、あるいはその装置と同じ文字を生成
し出力できるCRT表示装置、簡易校正プリンタ等であ
る。また、最終生成物がパーソナルコンピュータ等のC
RT装置に表示される電子出版の場合では、印刷側の印
刷装置は、対象となるパーソナルコンピュータ等の表示
システム、あるいはこのシステムと同じ文字を生成し出
力できるCRT装置、簡易校正プリンタ等である。
【0021】図1において、まず文書作成側の環境で
は、文書作成者はコンピュータ上で文書編集ソフトウエ
アなどを用いて文書を編集・作成する(S10)。作成
した文書について印刷の指示を入力すると、その文書の
データは、変換用ソフトウエアによりPostScri
ptなどの所定のPDLの記述に変換され(S12)、
このPDLのデータが当該環境に接続された印刷装置に
入力され印刷される(S14)。文書作成者は、この印
刷結果を例えばディスプレイ上に表示された文書のイメ
ージと比較するなどして、文字化けの検査を行う(S1
6)。もし、この段階で文字化けが発見された場合に
は、例えば文書編集ソフトウエアにて当該文書を修正し
(S18)、修正結果を再びPDLに変換して印刷して
文字化けを検査する(S12,S14,S16)。これ
を文字化けがなくなるまで繰り返すことにより、文書作
成者の意図を正しく反映したPDLの文書ファイル10
0を得ることができる。文書ファイル100が完成する
と、次に、この文書ファイル100を解析して、文字化
け検査用の検査用データファイル200を生成する(S
20)。この文字化け検査用データは、PDLのデータ
であり、その作成手順については後に詳述する。また、
この検査用データは、印刷装置に入力され、検査用シー
ト204として印刷出力される(S22)。文書ファイ
ル100及び検査用データファイル200は、例えばフ
レキシブルディスクなどの記録媒体202に格納され、
検査用シート204とともに印刷側の環境に送付され
る。
【0022】印刷環境では、文書作成側から送付された
記録媒体202、検査用シート204を受けとると(S
30)、記録媒体202から検査用データファイル20
0を読み出し、当該環境の印刷装置に入力して印刷する
(S32)。そして、この印刷結果の各文字と、文書作
成環境から受けとった検査用シート204との各文字と
を比較し(S34)、文字化けの有無を検査する。文字
化けがないことが確認できれば、記録媒体202の文書
ファイル100を印刷装置に入力して、印刷処理を行う
(S36)。また、文字化けがあった場合には、文字化
けした文字を正しく印刷するのに必要なフォントや文字
のデータを印刷環境側の印刷装置に登録したり、あるい
は文書作成側に文書から文字化けした文字を除いてもら
うなど、文字化けに対する対処を行う(S38)。
【0023】次に、本実施形態における文字化け検査用
データの生成のための装置構成及び処理手順について説
明する。
【0024】図2は、本実施形態の方法に適用される文
字化け検査用データ生成装置の構成を示す機能ブロック
図である。図2において、文字種抽出部10は、PDL
で記述された印刷対象の文書ファイル100から、文字
化けの検査を行う必要がある文字種を抽出する。本実施
形態では、フォント名及び文字コードの組み合わせによ
って特定される文字の種類のことを文字種と呼ぶ。抽出
した文字種の情報(すなわち、フォント及び文字コード
の組)は、順次文字種リスト12に登録されていく。候
補情報テーブル14は、文字化けの検査をすべき文字種
(言い換えれば、文字化けを起こす可能性がある文字
種)を示す情報が登録されている。前述の文字種抽出部
10は、この候補情報テーブル14を参照しつつ文字種
の抽出処理を行う。検査用データ生成部16は、文字種
リスト12の情報を受けとり、このリストの情報を編集
して検査用データファイル200を作成する。この際、
検査用データ生成部16は、リストに登録された文字種
を同一フォントごとに整理するなどの編集を行い、その
編集結果を予め登録されたスタイル情報18に従って組
版し、組版結果をPDLで記述することにより検査用デ
ータファイル200を作成する。ここで用いられるPD
Lは、前述の文書ファイルを記述するPDLと同じもの
である。作成された検査用データファイル200は、記
録媒体202に格納されるとともに、また紙に印刷され
て検査用シート204となる。
【0025】この文字化け検査用データ生成装置は、コ
ンピュータシステムにおいて、文字種抽出部10や検査
用データ生成部16の機能を記述したプログラムをメモ
リ上にロードし、CPUにてそのプログラムを実行する
ことにより構築することができる。文字種リスト12
は、例えばメモリ上に確保したワークエリアに構築され
る。候補情報テーブル14としては、予めユーザなどが
作成したものを例えばメモリ上にロードし、上記プログ
ラムからの参照を可能にする。このようなプログラムあ
るいはテーブルのデータは、媒体に記憶された状態で提
供される。プログラムなどを記憶した媒体としては、例
えばフレキシブルディスク、CD−ROM、メモリカー
ドなどを用いることができる。媒体に記録されたプログ
ラムやデータは、コンピュータシステムに組み込まれて
いる記憶装置、例えばハードディスク装置にインストー
ルされることにより、このプログラムを実行して本実施
形態に示した各機能を実現する文字化け検査用データ生
成装置の構築に寄与する。このような文字化け検査用デ
ータ生成のためのプログラムは、例えば、文書編集や組
版のためのソフトウエアに、ユーティリティソフトウエ
アの一つとして組み込むこともできる。
【0026】次に、図2の装置による文字化け検査用デ
ータの生成処理の手順を詳細に説明する。
【0027】図4は、以下の説明において具体例として
用いる文書を示す。図4は、図3の文書を印刷するため
のPDLの文書ファイル、すなわち図2における文書フ
ァイル100の一例を示している。この例は、PDLと
してPostScriptを用いた場合の例であり、繁
雑さを避けるために一部を省略している。
【0028】図4では、右欄に図3の文書を表すPDL
の記述を順に示し、左欄にPDL記述の意味、例えば文
書における対応する文字など、を示した。例えば、1行
目の“/FONT−A・・・”などはフォント指定のた
めの記述であり、“FONT−A”はフォント名、“f
f”はフォント名に対応するフォントを読み込むオペレ
ータ、“[7 0 ・・]”はフォントに対する座標変
換を表すマトリクス(サイズの変換などのために用い
る)、“mf”はフォントに対して前記マトリクスを適
用することにより新しいフォントを生成するオペレー
タ、“setf”はフォントを文字描画用のフォントと
してセットするオペレータである。したがって、文書フ
ァイルの1行目の記述は、フォント名が“FONT−
A”であるフォントをロードし、このフォントを指定さ
れたマトリクスにて変換し、この結果生成されたフォン
トを文字描画用のフォントとしてセットすることを表
す。フォント指定は、次のフォント指定がなされるまで
有効である。
【0029】また、文書ファイルの2行目及び3行目
は、図3の文書における文字「サ」の描画を指示する記
述である。ここで、2行目において、“−0 7”は座
標、“lcmt”はその座標を描画の基準位置にセット
するオペレータである。3行目において、“\203
T”は「サ」を示す文字コードであり、“sh”はその
文字コードの文字をその時点で有効なフォントを用いて
描画するオペレータである。従って、文書ファイルの2
行目及び3行目の記述によれば、2行目に指定された座
標を基準位置として、3行目で指定された文字コードの
文字「サ」が、フォント“FONT−A”(1行目で設
定)で描画される。以下、4及び5行目の記述で文字
「ン」、6及び7行目の記述で文字「プ」といった具合
に、位置指定と文字コード指定の2行一組で1つの文字
についての描画指示を表す。
【0030】図2の文字化け検査用データ生成装置にお
いて、文字種抽出部10は、このような文書ファイルの
PDL記述を先頭行から順に読み込んで解釈し、文書の
各文字の文字種を特定し、文字化け検査が必要な文字種
を抽出していく。なお、本実施形態では、文字種は、前
述したようにフォントと文字コードの組み合わせで特定
する。
【0031】また図5は、図2における候補情報テーブ
ル14の内容の一例を概念的に示したものである。実際
の候補情報テーブル14は、同様の内容をコンピュータ
で読み取り可能な形式で記述したものとなる。図5の例
では、文字化け検査が不要なフォントのフォント名が欄
300に、文字化け検査が不要な文字コードの範囲が欄
302に、文字化け検査が必要な文字コードの範囲が欄
304に、それぞれ登録されている。検査不要のフォン
トとしては、例えば文書作成環境及び印刷環境の両方に
インストールされ、文字化けがないことが分かっている
ものなどが考えられる。文字化け検査が不要な文字コー
ドとしては、例えばJISの第1水準や第2水準など、
フォントメーカー間で統一されている文字コードが考え
られる。図5の例ではその様な統一された文字コードの
範囲が、検査不要の文字コード範囲として、JIS区点
コードの形で登録されている(01区から10区、及び
16区〜83区)。本実施形態では、文字コード範囲に
該当する文字種は、基本的に文字化けの検査対象から外
す。ただし、JISの第1水準や第2水準のコードの範
囲内でも、例えば02区26点〜02区末尾や08区0
1点〜08区末尾などのように対応文字が未定義の範囲
があり、このような範囲の文字コードは各フォントメー
カーが自由に利用できる。このため、このようなJIS
に未定義の範囲の文字コードには、フォントごとに異な
った文字が割り当てられている可能性が高く、文字化け
の可能性がある。そこで、図5では、このような範囲
が、文字化け検査が不要な文字コード範囲の中の例外と
して、文字化け検査が必要な文字コード範囲の欄304
に登録されている。また、JISの新旧規格間で文字の
形が異なっている文字コード(例えば22区38点)も
あり、そのような文字コードも文字化け検査が必要な文
字コード範囲の欄304に登録されている。図5では、
文字コードがJIS区点コードで表されているが、文字
種抽出部10は、これをPDLが採用する例えば8進あ
るいは16進などのコード表現に変換して解釈する。こ
れら候補情報テーブル14の登録情報は、各文字種が文
字化け検査対象か否かを判定する際の判定条件として用
いられる。これら判定条件の適用の仕方については、後
述する具体的な処理手順の説明において詳しく述べる。
なお、候補情報テーブル14は、ユーザやシステム管理
者が予めエディタなどを用いて作成しておく。
【0032】以上説明した文書(図3及び図4)と候補
情報テーブル(図5)を具体例として、図2の装置によ
る文字化け検査用データの生成処理の手順を説明する。
図6は、この手順を示すフローチャートである。図6の
手順のうち、S202からS220までのステップは文
字種抽出部10で実行される手順を示し、S222から
S238までのステップは検査用データ生成部16によ
って実行される手順を示す。以下、図2〜図6を適宜参
照して説明する。
【0033】文字化け検査用データ生成装置にPDLの
文書ファイル100が与えられ、検査用データの生成処
理の指示が入力されると、まず文字種抽出部10は、処
理対象文字の順番を表すカウント値nを1に初期化する
(S202)。なお、文字種抽出部10は、このカウン
ト値nを管理するほか、現在の処理対象の文字を表すデ
ータ構造として、現時点で有効なフォントのフォント名
を表す文字列データと、当該文字の文字コードを表す8
進あるいは16進の整数値データと、を含む構造体を管
理している。この構造体を、以下「処理対象文字デー
タ」と呼ぶ。次に、文字種抽出部10は、文書ファイル
を順に読み取っていき、第n番目の文字のデータを取り
出す(S204)。ここで、文字種抽出部10は、例え
ば“sh”オペレータを文字の区切りとして、1文字ず
つのデータを判別する。S204では、取り出した文字
のデータからフォント名及び文字コードを切り出し、そ
れらを処理対象文字データにセットする。なお、文字の
データにフォント指定が含まれない場合は、処理対象文
字データのフォント名は変更されない。このようにして
文書ファイルから処理対象文字のデータが取り込まれる
と、次に、その処理対象文字のフォント名が、候補情報
テーブル14に登録された検査不要のフォント名に該当
するか否かを判定する(S206)。検査不要のフォン
トに該当する場合には、その文字は文字化け検査対象と
して抽出する必要はないと判断する。そして、文書ファ
イルの末尾に達したか否かを判定し(S218)、達し
ていない場合はカウント値nを1進めて(S220)次
の文字の処理に移行する。
【0034】S206の判定で、検査不要のフォントで
ないと判定された場合は、その処理対象文字の文字コー
ドが、候補情報テーブル14に登録された検査不要な文
字コード範囲に含まれるか否かを判定する(S20
8)。文字コードが検査不要な文字コード範囲に含まれ
る場合は、さらにその文字コードが、その範囲内でも例
外的に検査が必要な文字コードに該当するか否かを調べ
る(S210)。この結果、そのような例外には該当し
ないと判定された場合に、その処理対象文字は文字化け
検査対象として抽出する必要はないと判断する。そし
て、文書の末尾に達したか否かを判定し(S218)、
達していない場合はカウント値nを1進めて(S22
0)次の文字の処理に移行する。
【0035】S208の判定で検査が不要な文字コード
範囲に含まれないと判定された場合、あるいはS210
で検査が必要な文字コードに該当すると判定された場合
は、当該処理対象文字は文字化け検査対象と判断され、
当該処理対象文字のフォント名及び文字コードを文字種
リスト12に登録する。ただし、本実施形態では、文字
種リスト12に同じ文字種が重複して登録されることを
避けるために、処理対象文字のフォント名及び文字コー
ドを、その時点での文字種リスト12の各エントリと比
較し(S212)、同一文字種が既に文字種リスト12
に登録されているか否かを調べる(S214)。この結
果、処理対象文字が文字種リスト12に未登録と判定さ
れた場合は、その処理対象文字のフォント名及び文字コ
ードの組を文字種リスト12に登録する(S216)。
S214にて、同一文字種が既に登録されていると判定
された場合には、その処理対象文字は文字種リスト12
に登録しない。そして、いずれの場合にも、文書ファイ
ルの末尾に達したか否かを判定し(S218)、達して
いない場合はカウント値nを1進めて(S220)次の
文字の処理に移行する。
【0036】以上の手順を文書ファイルの末尾に達する
まで繰り返すことにより、文書ファイルから文字化け検
査対象に該当するすべての文字種を抽出することができ
る。
【0037】図7は、図4に示した文書ファイルを、図
5に示した候補情報テーブルを用いて上記手順に従って
処理したときに得られる文字種リスト12のデータ内容
を示している。図7では、分かりやすくするために文字
コードの欄には対応する文字自体を示しているが、実際
のデータでは整数値のコードが登録される。
【0038】このようにして文書ファイルから検査対象
文字種の抽出が完了すると、次に検査用データ生成部1
6が、文字種リスト12の各文字種データを所定の順序
にしたがってソートする(S222)。本実施形態で
は、まずフォント名に基づいて各文字種データをフォン
トごとに集めて整理し、その後各フォントごとについて
各文字種データを文字コードの例えば昇順に従って並べ
替える。
【0039】そして、検査用データ生成部16は、この
ソートされた文字種リスト12に基づき、以下のように
して検査用データファイル200を生成する。すなわ
ち、まずカウント値kを1に初期化する(S224)。
次に、文字種リスト12から第k文字のデータ(すなわ
ちフォント名と文字コード)を取り出す(S226)。
そして、カウント値kの値が1か否かを判定し(S22
8)、k=1の場合にはその文字(すなわち文字種リス
トの1番目の文字)のフォント名を表す文字列を印刷す
るためのPDL記述を生成し、検査用データファイル2
00に書き込む(S232)。また、S228にてkが
1でない場合は、その文字(すなわち第k文字)と一つ
前の文字(すなわち第(k−1)文字)のフォント名を
比較し(S230)、両者が一致しない場合は、その第
k文字のフォント名を印刷するためのPDL記述を生成
し、検査用データファイル200に書き込む(S23
2)。そして、フォント名の書き込みが終わると、次に
その第k文字の文字コードに基づきその文字を印刷する
ためのPDL記述を生成し、検査用データファイル20
0に書き込む(S234)。一方、S230の判定にて
第k文字のフォントが第(k−1)文字のフォントと同
じであった場合には、検査用データファイル200への
フォント名の書き込みは行わず、その第k文字を印刷す
るためのPDL記述を検査用データファイル200に出
力する(S234)。なお、S232及びS234で
は、検査用データ生成部16は、スタイル情報18を参
照して文字サイズなど必要なスタイルを決定し、そのス
タイルに基づきPDL記述を生成する。このS228〜
S234の処理によれば、1つのフォントに属する文字
のうちの先頭の文字を文字種リスト12から読み込んだ
ときに、そのフォントのフォント名のPDL記述が書き
込まれることになる。これにより、各フォントごとに、
フォント名とそのフォントに属する検査対象の文字とが
並んだ印刷結果を得ることができる。このような表示に
よれば、文字化けの検査の際に、文字化けが生じたフォ
ントの識別が容易となる。
【0040】そして、S234の処理が終わると、文字
種リスト12の末尾に達したか否かを判定し(S23
6)、達していない場合はカウント値kを1進め(S2
38)、S226に戻って上記の処理を繰り返す。この
ような処理を文字種リスト12の最後まで繰り返すこと
により、フォントごとに整理された検査対象の文字の一
覧を表示するためのデータからなる検査用データファイ
ル200が得られる。
【0041】図8に、このようにして得られた検査用デ
ータファイル200のPDL記述の一例を示す。この例
は、図4の文書ファイルから生成されたデータである。
図8においては、例えば“FONT−B”というフォン
ト名を示す文字列に対応するPDL記述のあとに、その
FONT−Bに属する検査対象の文字に対応するPDL
記述が続いている。そして、図8の検査用データを印刷
装置に入力すれば、図9に示す印刷結果を得ることがで
きる。
【0042】以上、本実施形態に置ける検査用データフ
ァイル200の作成手順を説明した。上記の手順に従っ
て得られた検査用データファイル200は、記録媒体2
02に格納されて印刷側に送られると共に、紙に印刷さ
れた検査用シート204の形でも印刷側に送られる。印
刷側では、この検査用データファイル200を印刷装置
に供給して紙に印刷し、その印刷結果を検査用シート2
04と比較することにより、文書作成側と印刷側との間
での文字化けを検査することができる。
【0043】以上説明したように、本実施形態によれ
ば、候補情報テーブル14に登録された条件から決定さ
れる検査対象の文字種のみが、印刷対象の文書ファイル
100から重複なく抽出される。このようにして抽出さ
れた文字種のみを文書作成側及び印刷側の両方で印刷
し、その印刷結果を比較することにより、文書作成側と
印刷側との間での文字化けの有無を検査することができ
る。本実施形態では、文字化けの起こる可能性が高い文
字だけを抽出して検査を行うので、文字化け検査に要す
る時間・労力を大幅に節約することができる。
【0044】なお、本実施形態に置いて、候補情報テー
ブル14に登録される情報は図5のような形式のものに
限られるものではなく、検査すべき文字種を特定できる
ものであればどのような形式でもよい。例えば、検査す
べき文字種を表すフォント名や文字コード、あるいはそ
れらの組合わせを列挙して登録したものを用いることも
できる。
【0045】また、ユーザが、文書編集ソフトウエアを
用い、文字化け検査をしたい文字種の一覧を示した文書
を通常の文書編集・作成と同様の方法で作成し、この文
書から候補情報テーブル14を自動生成することもでき
る。この場合、候補情報テーブル生成のツールが、ユー
ザの作成した文書からフォント名と文字コードとを抽出
し、これらの情報を候補情報テーブル14に登録してい
く。この方法によれば、ユーザが適宜候補情報テーブル
14をカスタマイズすることが可能となる。
【0046】なお、候補情報テーブル14の利用は、必
ずしも本発明にとって必須ではない。図10は、候補情
報テーブルを用いない場合の検査用データの作成処理の
手順、特に文字種抽出部10の処理手順を示すフローチ
ャートである。図10の方法では、検査用データの作成
指示が入力されると、文字種抽出部10は、カウント値
nを1に初期化し(S240)、文書ファイルから第n
文字を取り出す(S242)。上述の実施形態では、こ
のあと候補情報テーブル14を用いて検査対象の絞り込
みを行っていたが、この方法ではそのような絞り込みは
行わずに、その第n文字を文字種リスト12の登録デー
タと比較し(S244)、その文字が文字種リスト12
に既登録であるか否かだけを調べる(S246)。そし
て、その文字が未登録であれば、文字種リスト12に新
たに登録する(S248)。そして、以上の処理を文書
ファイルの末尾まで繰り返す(S250,S252)。
このような処理により、文書ファイルに含まれるすべて
の文字種が文字種リスト12に抽出される。以下、検査
用データ生成部16は、図6のS222以降の処理を行
い、文字種リスト12の情報から検査用データを作成す
る。このように、候補情報テーブルによる検査対象の絞
り込みを行なわず、文書ファイルに含まれる互いに異な
る文字種を抽出し、その一覧の印刷結果を用いて文字化
けを検査するという方法でも、文書の全文の印刷結果を
用いて文字化けを検査する場合よりも、文字化けのチェ
ックの労力・時間をはるかに低減することができる。
【0047】また、上記実施形態では、フォント名と文
字コードの組合わせにより文字種を特定したが、文字種
の特定の仕方はこれに限らない。例えば、フォント名、
文字コード以外に、文字サイズなど文字の他の属性も含
んだ組合わせにて文字種を特定してもよい。
【0048】また、上記実施形態において、検査用シー
トなどにおける検査対象の各文字の印刷サイズを、実際
の文書の印刷の場合と同じ大きさとすれば、ユーザは実
際の印刷状態に近い形の印刷結果に基づき文字化けの検
査を行うことができる。このためには、文書ファイルか
ら文字を抽出する際に、フォント名や文字コードだけで
なく、文字サイズの情報も抽出し、検査用データを作成
する際に、その文字サイズの情報を反映したPDL記述
を生成すればよい。
【0049】また、文字化け検査用の検査用データの応
用方法として次のようなものも考えられる。すなわち、
一般にDTPシステムなどで文書を作成した場合には、
図1のS14〜S18のように、ディスプレイの表示と
印刷結果とを照合して正しい印刷結果が得られているか
を確認するが、このような確認作業に検査用データを適
用することにより、作業効率を改善することができる。
この方法では、作成した検査用データをディスプレイに
表示すると共にプリンタにて印刷し、ディスプレイ表示
と印刷結果とを比較して、ディスプレイ表示と印刷結果
との間での文字化けをチェックする。この方法によれ
ば、文書作成環境におけるディスプレイ表示と印刷結果
との間での文字化けの検査にかかる労力、時間を節約す
ることができる。
【0050】また、本発明は、PDLで記述された文書
ファイルだけでなく、その他のデータ形式で表された文
書ファイルにも適用可能である。
【0051】また、検査用データファイル200の印刷
環境への伝達は、記録媒体を介することなく、例えばデ
ータ通信にて行ってもよい。
【0052】
【発明の効果】以上説明したように、本発明によれば、
印刷対象の文書から互いに異なる文字だけ、あるいは文
字化けの可能性がある検査対象文字種だけを抽出し、こ
れら抽出された文字種の印刷結果を比較することにより
文字化けの検査を行うので、文書の全文の印刷結果を用
いて文字化けを検査する場合よりも、文字化けのチェッ
クの労力・時間をはるかに低減することができる。
【図面の簡単な説明】
【図1】 本発明に係る文字化け検査方法の全体の流れ
を示すフローチャートである。
【図2】 本発明に係る文字化け検査用データ生成装置
の構成を示す機能ブロック図である。
【図3】 印刷対象の文書の一例を示す図である。
【図4】 図4の文書を表すページ記述言語(PDL)
の記述例を示す図である。
【図5】 候補情報テーブルの内容の一例を示す図であ
る。
【図6】 文字化け検査用データ生成装置の処理手順を
示すフローチャートである。
【図7】 文字種リストのデータ内容を示す図である。
【図8】 検査用データファイルの記述例を示す図であ
る。
【図9】 図8の検査用データファイルの印刷例を示す
図である。
【図10】 候補情報テーブルを用いない場合の検査用
データの作成処理の手順の要部を示すフローチャートで
ある。
【符号の説明】
10 文字種抽出部、12 文字種リスト、14 候補
情報テーブル、16検査用データ生成部、18 スタイ
ル情報、100 文書ファイル、200 検査用データ
ファイル、202 記録媒体、204 検査用シート。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 3/12 B41J 5/30 B41J 29/46

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の情報処理環境で作成した文書を第
    2の情報処理環境で印刷する際の文字化けを検査する方
    法であって、 前記第1の情報処理環境にて、作成した文書に含まれる
    互いに異なる文字種を抽出して検査用データを作成し、
    この検査用データを印刷し、 前記検査用データ及びその印刷結果を前記第2の情報処
    理環境に伝達し、 前記第2の情報処理環境にて、伝達された前記検査用デ
    ータを印刷し、この印刷結果を前記第1の情報処理環境
    における印刷結果と比較することにより文字化けを検査
    することを特徴とする文字化け検査方法。
  2. 【請求項2】 第1の情報処理環境で作成した文書を第
    2の情報処理環境で印刷する際の文字化けを検査する方
    法であって、 前記第1の情報処理環境にて、作成した文書から文字化
    けの可能性が高い文字種のみを抽出して検査用データを
    作成し、この検査用データを印刷し、 前記検査用データ及びその印刷結果を前記第2の情報処
    理環境に伝達し、 前記第2の情報処理環境にて、伝達された前記検査用デ
    ータを印刷し、この印刷結果を前記第1の情報処理環境
    における印刷結果と比較することにより文字化けを検査
    することを特徴とする文字化け検査方法。
  3. 【請求項3】 第1の情報処理環境で作成した検査用デ
    ータを印刷した印刷物と、該検査用データを第2の情報
    処理環境で印刷した印刷物と、を比較することにより、
    前記第1の情報処理環境で作成した文書を前記第2の情
    報処理環境で印刷する際の文字化けを検査するために、
    前記検査用データを作成する文字化け検査用データ作成
    装置であって、 前記第1の情報処理環境で作成した 文書データに含まれ
    る互いに異なる文字種を抽出する文字種抽出手段と、前記 抽出した文字種のデータに基づき前記検査用データ
    成する検査用データ成手段と、 を含むことを特徴とする文字化け検査用データ作成装
    置。
  4. 【請求項4】 第1の情報処理環境で作成した検査用デ
    ータを印刷した印刷物と、該検査用データを第2の情報
    処理環境で印刷した印刷物と、を比較するこ とにより、
    前記第1の情報処理環境で作成した文書を前記第2の情
    報処理環境で印刷する際の文字化けを検査するために、
    前記検査用データを作成する文字化け検査用データ作成
    装置であって、 文字化け検査対象文字種を特定するための情報が登録さ
    れた候補情報テーブルと、前記第1の情報処理環境で作成した 文書データから、前
    記候補情報テーブルの情報によって特定される文字化け
    検査対象文字種に含まれる文字種を抽出する文字種抽出
    手段と、前記 抽出した文字種のデータに基づき前記検査用データ
    成する検査用データ成手段と、 を含むことを特徴とする文字化け検査用データ作成装
    置。
  5. 【請求項5】 請求項3又は4に記載の装置であって、 前記検査用データ成手段は、前記抽出した文字種をフ
    ォントごとに整理して配列することを特徴とする文字化
    け検査用データ作成装置。
  6. 【請求項6】 請求項5記載の装置であって、 前記検査用データ成手段は、各フォントごとに整理し
    た文字種の配列に対し、当該配列に対応するフォント名
    を表す文字列データを付加する機能を有することを特徴
    とする文字化け検査用データ作成装置。
JP31514596A 1996-11-26 1996-11-26 文字化け検査方法及び文字化け検査用データ作成装置 Expired - Fee Related JP3402971B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31514596A JP3402971B2 (ja) 1996-11-26 1996-11-26 文字化け検査方法及び文字化け検査用データ作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31514596A JP3402971B2 (ja) 1996-11-26 1996-11-26 文字化け検査方法及び文字化け検査用データ作成装置

Publications (2)

Publication Number Publication Date
JPH10161825A JPH10161825A (ja) 1998-06-19
JP3402971B2 true JP3402971B2 (ja) 2003-05-06

Family

ID=18061961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31514596A Expired - Fee Related JP3402971B2 (ja) 1996-11-26 1996-11-26 文字化け検査方法及び文字化け検査用データ作成装置

Country Status (1)

Country Link
JP (1) JP3402971B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152851A (ja) * 2007-12-20 2009-07-09 Nec Corp 印刷検査システム及び印刷検査方法
US8619278B2 (en) * 2009-12-04 2013-12-31 Ricoh Company, Limited Printed matter examination apparatus, printed matter examination method, and printed matter examination system
JP6379645B2 (ja) * 2014-05-07 2018-08-29 日産自動車株式会社 燃料ガス充填システム及び燃料ガス充填方法
JP7449111B2 (ja) 2020-02-18 2024-03-13 キヤノン株式会社 検査装置、検査方法

Also Published As

Publication number Publication date
JPH10161825A (ja) 1998-06-19

Similar Documents

Publication Publication Date Title
US6533822B2 (en) Creating summaries along with indicators, and automatically positioned tabs
US7996759B2 (en) Data insertion from a database into a fixed electronic template form that supports overflow data
US6816630B1 (en) System and method for creating and processing data forms
CN111680634B (zh) 公文文件处理方法、装置、计算机设备及存储介质
US7408556B2 (en) System and method for using device dependent fonts in a graphical display interface
CN102081594A (zh) 从可移植电子文档中提取字符外接矩形的设备和方法
US20020035466A1 (en) Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
US20030046314A1 (en) Text processing device, text processing method and program therefor
JP3402971B2 (ja) 文字化け検査方法及び文字化け検査用データ作成装置
JPH11272654A (ja) 文書編集装置及び方法
JP2019179470A (ja) 情報処理プログラム、情報処理方法、および情報処理装置
US20020181779A1 (en) Character and style recognition of scanned text
JP2001101036A (ja) ログ情報の格納及び利用方法
JPH0883280A (ja) 文書処理装置
JP2001034611A (ja) 読み情報出力装置および記録媒体
KR100366657B1 (ko) 프린트 출력 이미지의 텍스트 파일 역변환 방법 및 그 장치
JP3016040B2 (ja) 自然言語処理システム
JP2003132078A (ja) データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体
KR100544375B1 (ko) 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체
JP2000011095A (ja) 文字認識装置及び方法
CN114706541A (zh) 单据打印方法、装置及计算机可读介质
Neubauer Conversion from WORD/WordPerfect to LATEX
CN118075373A (zh) 基于模板的飞机acars报文的解析方法
JPH04243477A (ja) 自然言語処理システムによる索引語抽出方法
van Arkel Advantages and disadvantages of computer aided editing

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080229

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees