JPH10161825A - Illegal character check method, and device for generating illegal character check data - Google Patents

Illegal character check method, and device for generating illegal character check data

Info

Publication number
JPH10161825A
JPH10161825A JP8315145A JP31514596A JPH10161825A JP H10161825 A JPH10161825 A JP H10161825A JP 8315145 A JP8315145 A JP 8315145A JP 31514596 A JP31514596 A JP 31514596A JP H10161825 A JPH10161825 A JP H10161825A
Authority
JP
Japan
Prior art keywords
character
data
inspection
document
garbled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8315145A
Other languages
Japanese (ja)
Other versions
JP3402971B2 (en
Inventor
Hideki Shibata
英樹 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dainippon Screen Manufacturing Co Ltd filed Critical Dainippon Screen Manufacturing Co Ltd
Priority to JP31514596A priority Critical patent/JP3402971B2/en
Publication of JPH10161825A publication Critical patent/JPH10161825A/en
Application granted granted Critical
Publication of JP3402971B2 publication Critical patent/JP3402971B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To save the manhour for illegal character check when a document is printed in an environment that is different from the document generation environment. SOLUTION: At the document generation side, a character type extraction part 10 refers to a candidate information table 14 to extract a character to undergo the illegal character check from a document file 100 and registers the combination of the character font name and code (called a character type) in a character type list 12. A check data generation part 16 edits the character type data of the list 12, composes the editing result based on the style information 18 and produces a check data file 200 to shown the composition result. The file 200 is stored in a recording medium 202 and also printed on the paper as a check sheet 204. These medium 202 and the sheet 204 are sent to the print side. At the printing side, the file 200 is printed on the paper and the illegal characters are checked between the document production and print sides by comparing the printed result with the sheet 204.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ある情報処理環境
で作成した文書を別の情報処理環境で印刷したときの文
字化けを検査する方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for checking garbled characters when a document created in one information processing environment is printed in another information processing environment.

【0002】[0002]

【従来の技術】一般に印刷物は、企画、原稿作成、編
集、組版、印刷の工程を経て作成される。近年、編集以
降の工程は電子化が進み、例えばDTP(デスクトップ
・パブリッシング)システムなどの形で具現化され、広
く利用されている。
2. Description of the Related Art In general, a printed matter is created through the steps of planning, manuscript creation, editing, typesetting, and printing. In recent years, the processes after editing have been digitized, and are embodied in the form of, for example, a desktop publishing (DTP) system and are widely used.

【0003】また、コンピュータからプリンタへ転送す
る印刷データのフォーマットとして、ページ記述言語
(以下、PDLという)が普及している。PDLは、プ
リンタの能力(解像度など)に依存しない形で各ページ
の印刷イメージを記述することができ、プリンタは、P
DLで記述されたイメージを自らの解像度などに応じて
印刷する。コンピュータ側では、文書編集ソフトウエア
などにて文書を作成し、印刷の際にその文書のデータか
らPDLデータを生成してプリンタに送信する。プリン
タは、PDLの解釈機構を有しており、PDLデータを
解釈してメモリ上に各ページのラスタイメージを生成
し、そのラスタイメージに従って紙などに印刷を行う。
近年では、PostScript(米国AdobeSy
stems社の商標)がPDLの事実上の標準として広
く普及しており、個人用から業務用まで、様々な種類の
PostScript対応の印刷装置が発売されてい
る。
As a format of print data transferred from a computer to a printer, a page description language (PDL) has been widely used. The PDL can describe a print image of each page in a form independent of the capability (resolution, etc.) of the printer.
The image described in DL is printed according to its own resolution or the like. On the computer side, a document is created by document editing software or the like, and PDL data is generated from the data of the document at the time of printing and transmitted to a printer. The printer has a PDL interpreting mechanism, interprets the PDL data, generates a raster image of each page on a memory, and performs printing on paper or the like according to the raster image.
In recent years, PostScript (AdobeSysy, USA)
(a trademark of Stems Inc.) has become widespread as a de facto standard of PDL, and various types of PostScript-compatible printing apparatuses have been released from personal use to business use.

【0004】このような状況のもと、顧客から文書のデ
ータをPostScriptなどのPDLの形で受けと
り印刷処理を代行するサービスが登場している。また印
刷業界においても、原稿の内容を電子的に編集する業者
と、この業者から文書をPDLデータの形で受けとって
タイプセッターに出力するいわゆる「出力センター」な
る業者との分業化が進んでいる。このように、近年で
は、文書を、作成した環境とは別の環境で印刷する場合
が増えてきている。
[0004] Under such circumstances, a service that receives document data from a customer in the form of PDL such as PostScript and performs printing processing has appeared. Also in the printing industry, the division of labor into a so-called "output center", which is a company that edits the contents of a manuscript electronically, and a company that receives a document from this company in the form of PDL data and outputs it to a type setter, is progressing. . Thus, in recent years, the number of cases in which a document is printed in an environment different from the environment in which the document was created has been increasing.

【0005】ところが、文書作成側の環境にあるフォン
トが印刷側の環境にない場合や、あるいは文書作成側と
印刷側とで外字等の文字コードが一致しない場合などが
往々にしてあり、このような場合には、文書作成側が意
図した文字が印刷側で正しく印刷されず、いわゆる文字
化けが生じることがあった。このため、従来は、印刷側
で出力した印刷結果と元の原稿とをつき合わせて、すべ
ての文字が文書作成者の意図どおりに印刷されているか
をチェックしていた。
However, there are many cases where the font in the environment on the document creating side is not in the environment on the printing side, or when the character codes such as external characters do not match between the document creating side and the printing side. In such a case, characters intended by the document creator may not be correctly printed on the print side, resulting in so-called garbled characters. For this reason, conventionally, the print result output on the printing side is compared with the original document to check whether all characters are printed as intended by the document creator.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、このよ
うなチェック作業に要する時間や労力は膨大なものであ
り、省力化の方策が求められていた。
However, the time and labor required for such a check operation is enormous, and a measure for labor saving has been required.

【0007】本発明は、このような問題を解決するため
になされたものであり、文書を、その文書を作成した環
境とは別の環境で印刷する場合における、文字化けの検
査を省力化するための方法及び装置を提供することを目
的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and it is possible to save labor for checking for garbled characters when a document is printed in an environment different from the environment in which the document was created. It is an object to provide a method and an apparatus for the same.

【0008】[0008]

【課題を解決するための手段】前述の目的を達成するた
めに、本発明に係る文字化け検査方法は、第1の情報処
理環境で作成した文書を第2の情報処理環境で印刷する
際の文字化けを検査する方法であって、前記第1の情報
処理環境にて、作成した文書に含まれる互いに異なる文
字種を抽出して検査用データを作成し、この検査用デー
タを印刷し、前記検査用データ及びその印刷結果を前記
第2の情報処理環境に伝達し、前記第2の情報処理環境
にて、伝達された前記検査用データを印刷し、この印刷
結果を前記第1の情報処理環境における印刷結果と比較
することにより文字化けを検査することを特徴とする。
In order to achieve the above object, a garbled text inspection method according to the present invention provides a method for printing a document created in a first information processing environment in a second information processing environment. A method for inspecting garbled characters, wherein in the first information processing environment, different types of characters included in a created document are extracted to create inspection data, and the inspection data is printed, Transmitting the test data and the print result thereof to the second information processing environment, printing the transmitted test data in the second information processing environment, and transmitting the print result to the first information processing environment. The garbled character is inspected by comparing the result with the print result.

【0009】この構成において、文字種とは、文字コー
ドやフォントなどによって特定される個々の「文字」の
ことである。この構成では、文書を作成した第1の情報
処理環境にて、文書から互いに異なる文字種のみを抽出
して検査用データを作成する。この検査用データの第1
の情報処理環境での印刷結果を、文書を印刷する第2の
情報処理環境での当該検査用データの印刷結果と比較す
ることにより、両環境間での文字化けを検出する。この
構成によれば、文書中の重複した文字が省かれたものが
検査用データとなるので、検査用データのサイズ、すな
わち文字数は、元の文書に比べて極めて小さいものとな
る。従って、この構成によれば、文書の全文をつき合わ
せる場合よりもはるかに少ない時間・労力で文字化けを
チェックすることができる。
In this configuration, the character type is an individual "character" specified by a character code, a font, or the like. In this configuration, in the first information processing environment in which a document is created, only different character types are extracted from the document to create inspection data. The first of this inspection data
By comparing the print result in the second information processing environment for printing a document with the print result in the second information processing environment, garbled characters between the two environments are detected. According to this configuration, the data in which duplicate characters in the document are omitted is used as the inspection data, so that the size of the inspection data, that is, the number of characters, is extremely small as compared with the original document. Therefore, according to this configuration, it is possible to check for garbled characters with much less time and effort than in the case of matching the entire text of a document.

【0010】また、本発明は、第1の情報処理環境に
て、作成した文書から所定の検査対象文字種に含まれる
文字種を抽出して検査用データを作成し、この検査用デ
ータを印刷し、前記検査用データ及びその印刷結果を第
2の情報処理環境に伝達し、第2の情報処理環境にて、
伝達された前記検査用データを印刷し、この印刷結果を
前記第1の情報処理環境における印刷結果と比較するこ
とにより文字化けを検査することを特徴とする。
Further, according to the present invention, in a first information processing environment, a character type included in a predetermined character type to be inspected is extracted from a created document to create inspection data, and the inspection data is printed. Transmitting the inspection data and a print result thereof to a second information processing environment, and in the second information processing environment,
The transmitted test data is printed, and the print result is compared with the print result in the first information processing environment to check for garbled characters.

【0011】この構成では、作成した文書に含まれる全
文字種を文字化け検査の対象とせずに、あらかじめ定め
られた検査対象文字種に該当する文字種のみを文字化け
検査の対象とする。すなわち、例えばJISの第1水準
などの文字は、標準化されており文字化けの可能性は極
めて低い。このような文字化けの可能性が低い文字種を
除いた文字化けの可能性の高い文字種のみを検査対象文
字種とし、この検査対象文字種に該当するもののみを抽
出することにより、検査用データのサイズをさらに小さ
くすることができ、効率よく文字化け検査を行うことが
できる。
In this configuration, all character types included in the created document are not subjected to the garbled character inspection, but only the character type corresponding to the predetermined character to be inspected is subjected to the garbled character inspection. That is, for example, characters such as JIS first level are standardized and the possibility of garbled characters is extremely low. Only the character types that are highly likely to be garbled, excluding the character types that are unlikely to be garbled, are set as inspection target character types, and only those that correspond to the inspection target character types are extracted, thereby reducing the size of the inspection data. The size can be further reduced, and the garbled test can be performed efficiently.

【0012】また、前述の目的を達成するために、本発
明に係る文字化け検査用データ作成装置は、印刷対象の
文書データに含まれる互いに異なる文字種を抽出する文
字種抽出手段と、抽出した文字種のデータに基づき検査
用データを生成するデータ生成手段とを含むことを特徴
とする。この構成によれば、印刷対象の文書データに含
まれるすべての文字種を抽出し、検査用データを作成す
ることができる。
Further, in order to achieve the above object, a garbled character inspection data generating apparatus according to the present invention comprises a character type extracting means for extracting different character types included in document data to be printed, Data generating means for generating inspection data based on the data. According to this configuration, all the character types included in the document data to be printed can be extracted, and the inspection data can be created.

【0013】また、本発明に係る文字化け検査用データ
作成装置は、文字化け検査対象文字種を特定するための
情報が登録された候補情報テーブルと、印刷対象の文書
データから、前記候補情報テーブルの情報によって特定
される検査対象文字種に含まれる文字種を抽出する文字
種抽出手段と、抽出した文字種のデータに基づき検査用
データを生成するデータ生成手段とを含むことを特徴と
する。この構成では、候補情報テーブルには、文字化け
の検査をすべき検査対象文字種を特定するための情報が
登録される。文字種抽出手段は、この候補情報テーブル
の情報に基づき、印刷対象の文書データから検査対象に
該当する文字種を抽出する。この構成によれば、印刷対
象の文書に含まれる文字のうち、検査対象のもののみを
抽出して検査用データを生成することができる。
Further, the garbled character inspection data creating apparatus according to the present invention uses the candidate information table in which information for specifying the character type to be subjected to the garbled character inspection is registered, and the candidate information table from the document data to be printed. It is characterized by including character type extraction means for extracting a character type included in the inspection target character type specified by the information, and data generation means for generating inspection data based on the extracted character type data. In this configuration, information for specifying a character type to be inspected for which a garbled character is to be inspected is registered in the candidate information table. The character type extracting unit extracts a character type corresponding to the inspection target from the document data to be printed based on the information in the candidate information table. According to this configuration, of the characters included in the document to be printed, only those to be inspected can be extracted to generate inspection data.

【0014】本発明の好適な態様では、データ生成手段
は、文字種抽出手段にて抽出した文字種をフォントごと
に整理して配列することを特徴とする。この構成によれ
ば、検査用データにおいて、各文字種がフォントごとに
整理して配列されるため、この検査用データの印刷結果
には、検査すべき各文字種がフォントごとに配列して表
示されるので、検査がしやすくなる。
In a preferred aspect of the present invention, the data generation means arranges the character types extracted by the character type extraction means for each font. According to this configuration, in the inspection data, each character type is arranged and arranged for each font. Therefore, in the print result of the inspection data, each character type to be inspected is arranged and displayed for each font. Therefore, the inspection becomes easier.

【0015】さらに好適には、データ生成手段は、各フ
ォントごとに整理した文字種の配列に対し、当該配列に
対応するフォント名を表す文字列データを付加する機能
を有する。この構成によれば、検査用データの印刷結果
には、フォントごとの各文字種の配列に対して当該配列
に対応するフォント名が印刷されるので、文字化けの検
査においてフォント名の特定が容易となる。
[0015] More preferably, the data generating means has a function of adding character string data representing a font name corresponding to the arrangement to an arrangement of character types arranged for each font. According to this configuration, since the font name corresponding to the arrangement of each character type for each font is printed in the print result of the inspection data, it is easy to specify the font name in the inspection for garbled characters. Become.

【0016】また、本発明は、コンピュータを、印刷対
象の文書データに含まれるすべての文字種を抽出する手
段、抽出した文字種のデータに基づき検査用データを生
成する手段、として機能させるためのプログラムを記録
した記録媒体を提供する。
Further, the present invention provides a program for causing a computer to function as means for extracting all character types included in document data to be printed and means for generating inspection data based on the extracted character type data. A recorded recording medium is provided.

【0017】また、本発明は、コンピュータを、文字化
け検査の対象文字種が登録された候補情報テーブルに含
まれる文字種を印刷対象の文書データから抽出する手
段、抽出した文字種のデータに基づき検査用データを生
成する手段、として機能させるためのプログラムを記録
した記録媒体を提供する。
According to the present invention, there is further provided a computer for extracting a character type included in a candidate information table in which a character type to be subjected to garbled inspection is registered from document data to be printed, and a check data based on the extracted character type data. And a recording medium storing a program for causing the program to function as a unit for generating a program.

【0018】なお、前記記録媒体の概念には、フレキシ
ブルディスクなどの磁気媒体やCD−ROMや光磁気デ
ィスクなどの光学読取式媒体、ROMやフラッシュメモ
リなどの半導体記憶媒体など、プログラムを記録した機
械読取り可能なすべての媒体が含まれる。なお、上記プ
ログラムを通信媒体を経由して提供・記録する方法も本
発明の態様に含まれる。
Note that the concept of the recording medium includes machines that record programs, such as a magnetic medium such as a flexible disk, an optical reading medium such as a CD-ROM and a magneto-optical disk, and a semiconductor storage medium such as a ROM and a flash memory. Includes all readable media. Note that a method of providing and recording the above program via a communication medium is also included in the aspect of the present invention.

【0019】[0019]

【発明の実施の形態】以下、本発明の好適な実施形態を
図面に基づいて説明する。まず、図1を用いて、本発明
に係る文字化け検査の全体的な処理手順を説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described below with reference to the drawings. First, the overall processing procedure of the garbled text inspection according to the present invention will be described with reference to FIG.

【0020】図1に示す処理の前提として、文書作成側
の環境と印刷側の環境には、共通のPDL(例えばPo
stScript)を処理できる印刷装置が接続されて
いるものとする。文書作成側の印刷装置は、作成した文
書データの文字内容が文書の原稿と比較して誤りがない
ことを確かめるための装置であり、少なくとも文書で使
用されている全ての文字の出力が可能なCRT表示装置
やレーザプリンタ等の装置である。印刷側の印刷装置
は、最終生成物あるいはそれと等価な物を出力できる装
置であり、最終生成物が印刷紙の場合、校正用印刷物を
作成する校正装置、あるいはその装置と同じ文字を生成
し出力できるCRT表示装置、簡易校正プリンタ等であ
る。また、最終生成物がパーソナルコンピュータ等のC
RT装置に表示される電子出版の場合では、印刷側の印
刷装置は、対象となるパーソナルコンピュータ等の表示
システム、あるいはこのシステムと同じ文字を生成し出
力できるCRT装置、簡易校正プリンタ等である。
As a prerequisite for the processing shown in FIG. 1, a common PDL (for example, PoD
It is assumed that a printing apparatus capable of processing (stScript) is connected. The printing device on the document creation side is a device for confirming that the character content of the created document data is correct by comparing it with the document manuscript, and can output at least all the characters used in the document. It is a device such as a CRT display device and a laser printer. The printing device on the printing side is a device that can output the final product or its equivalent.If the final product is printed paper, a proofing device that creates a proof print, or generates and outputs the same characters as the device CRT display device, simple calibration printer, etc. The final product is C
In the case of electronic publishing displayed on an RT device, the printing device on the printing side is a display system such as a target personal computer, a CRT device capable of generating and outputting the same characters as this system, a simple proof printer, and the like.

【0021】図1において、まず文書作成側の環境で
は、文書作成者はコンピュータ上で文書編集ソフトウエ
アなどを用いて文書を編集・作成する(S10)。作成
した文書について印刷の指示を入力すると、その文書の
データは、変換用ソフトウエアによりPostScri
ptなどの所定のPDLの記述に変換され(S12)、
このPDLのデータが当該環境に接続された印刷装置に
入力され印刷される(S14)。文書作成者は、この印
刷結果を例えばディスプレイ上に表示された文書のイメ
ージと比較するなどして、文字化けの検査を行う(S1
6)。もし、この段階で文字化けが発見された場合に
は、例えば文書編集ソフトウエアにて当該文書を修正し
(S18)、修正結果を再びPDLに変換して印刷して
文字化けを検査する(S12,S14,S16)。これ
を文字化けがなくなるまで繰り返すことにより、文書作
成者の意図を正しく反映したPDLの文書ファイル10
0を得ることができる。文書ファイル100が完成する
と、次に、この文書ファイル100を解析して、文字化
け検査用の検査用データファイル200を生成する(S
20)。この文字化け検査用データは、PDLのデータ
であり、その作成手順については後に詳述する。また、
この検査用データは、印刷装置に入力され、検査用シー
ト204として印刷出力される(S22)。文書ファイ
ル100及び検査用データファイル200は、例えばフ
レキシブルディスクなどの記録媒体202に格納され、
検査用シート204とともに印刷側の環境に送付され
る。
Referring to FIG. 1, first, in an environment on the document creating side, a document creator edits and creates a document using document editing software on a computer (S10). When a print instruction is input for the created document, the data of the document is converted to PostScript by the conversion software.
is converted into a description of a predetermined PDL such as pt (S12),
The PDL data is input to a printing device connected to the environment and printed (S14). The document creator checks the garbled character by comparing the print result with an image of the document displayed on the display, for example (S1).
6). If garbled characters are found at this stage, the document is corrected by, for example, document editing software (S18), and the corrected result is converted to PDL again and printed to check for garbled characters (S12). , S14, S16). This is repeated until the characters are not garbled, so that the PDL document file 10 that correctly reflects the intention of the document creator.
0 can be obtained. When the document file 100 is completed, the document file 100 is analyzed to generate an inspection data file 200 for garbled character inspection (S
20). The garbled inspection data is PDL data, and the procedure for creating the data will be described later in detail. Also,
The inspection data is input to the printing device and printed out as the inspection sheet 204 (S22). The document file 100 and the inspection data file 200 are stored in a recording medium 202 such as a flexible disk, for example.
It is sent to the printing environment together with the inspection sheet 204.

【0022】印刷環境では、文書作成側から送付された
記録媒体202、検査用シート204を受けとると(S
30)、記録媒体202から検査用データファイル20
0を読み出し、当該環境の印刷装置に入力して印刷する
(S32)。そして、この印刷結果の各文字と、文書作
成環境から受けとった検査用シート204との各文字と
を比較し(S34)、文字化けの有無を検査する。文字
化けがないことが確認できれば、記録媒体202の文書
ファイル100を印刷装置に入力して、印刷処理を行う
(S36)。また、文字化けがあった場合には、文字化
けした文字を正しく印刷するのに必要なフォントや文字
のデータを印刷環境側の印刷装置に登録したり、あるい
は文書作成側に文書から文字化けした文字を除いてもら
うなど、文字化けに対する対処を行う(S38)。
In the printing environment, upon receiving the recording medium 202 and the inspection sheet 204 sent from the document creation side (S
30), the inspection data file 20 from the recording medium 202;
0 is read out, input to the printing device in the environment, and printed (S32). Then, each character of the print result is compared with each character of the inspection sheet 204 received from the document creation environment (S34), and the presence or absence of garbled characters is inspected. If it is confirmed that there is no garbled character, the document file 100 on the recording medium 202 is input to the printing device and printing is performed (S36). In addition, when garbled characters are found, fonts and character data necessary for correctly printing garbled characters are registered in the printing device on the printing environment side, or garbled characters from the document on the document creation side. Countermeasures against garbled characters, such as removing characters, are taken (S38).

【0023】次に、本実施形態における文字化け検査用
データの生成のための装置構成及び処理手順について説
明する。
Next, an apparatus configuration and a processing procedure for generating garbled character inspection data in the present embodiment will be described.

【0024】図2は、本実施形態の方法に適用される文
字化け検査用データ生成装置の構成を示す機能ブロック
図である。図2において、文字種抽出部10は、PDL
で記述された印刷対象の文書ファイル100から、文字
化けの検査を行う必要がある文字種を抽出する。本実施
形態では、フォント名及び文字コードの組み合わせによ
って特定される文字の種類のことを文字種と呼ぶ。抽出
した文字種の情報(すなわち、フォント及び文字コード
の組)は、順次文字種リスト12に登録されていく。候
補情報テーブル14は、文字化けの検査をすべき文字種
(言い換えれば、文字化けを起こす可能性がある文字
種)を示す情報が登録されている。前述の文字種抽出部
10は、この候補情報テーブル14を参照しつつ文字種
の抽出処理を行う。検査用データ生成部16は、文字種
リスト12の情報を受けとり、このリストの情報を編集
して検査用データファイル200を作成する。この際、
検査用データ生成部16は、リストに登録された文字種
を同一フォントごとに整理するなどの編集を行い、その
編集結果を予め登録されたスタイル情報18に従って組
版し、組版結果をPDLで記述することにより検査用デ
ータファイル200を作成する。ここで用いられるPD
Lは、前述の文書ファイルを記述するPDLと同じもの
である。作成された検査用データファイル200は、記
録媒体202に格納されるとともに、また紙に印刷され
て検査用シート204となる。
FIG. 2 is a functional block diagram showing a configuration of a garbled character inspection data generating apparatus applied to the method of the present embodiment. In FIG. 2, the character type extraction unit 10
The character type that needs to be checked for garbled characters is extracted from the document file 100 to be printed described in. In the present embodiment, a type of character specified by a combination of a font name and a character code is referred to as a character type. The extracted information on the character type (that is, the combination of the font and the character code) is sequentially registered in the character type list 12. The candidate information table 14 has registered therein information indicating a character type to be checked for garbled characters (in other words, a character type that may cause garbled characters). The above-described character type extraction unit 10 performs character type extraction processing with reference to the candidate information table 14. The inspection data generation unit 16 receives the information of the character type list 12 and edits the information of this list to create an inspection data file 200. On this occasion,
The inspection data generation unit 16 performs editing such as organizing the character types registered in the list for each same font, typesetting the editing result according to the style information 18 registered in advance, and describing the typesetting result in PDL. To create an inspection data file 200. PD used here
L is the same as the PDL describing the document file described above. The created inspection data file 200 is stored in the recording medium 202 and is also printed on paper to become an inspection sheet 204.

【0025】この文字化け検査用データ生成装置は、コ
ンピュータシステムにおいて、文字種抽出部10や検査
用データ生成部16の機能を記述したプログラムをメモ
リ上にロードし、CPUにてそのプログラムを実行する
ことにより構築することができる。文字種リスト12
は、例えばメモリ上に確保したワークエリアに構築され
る。候補情報テーブル14としては、予めユーザなどが
作成したものを例えばメモリ上にロードし、上記プログ
ラムからの参照を可能にする。このようなプログラムあ
るいはテーブルのデータは、媒体に記憶された状態で提
供される。プログラムなどを記憶した媒体としては、例
えばフレキシブルディスク、CD−ROM、メモリカー
ドなどを用いることができる。媒体に記録されたプログ
ラムやデータは、コンピュータシステムに組み込まれて
いる記憶装置、例えばハードディスク装置にインストー
ルされることにより、このプログラムを実行して本実施
形態に示した各機能を実現する文字化け検査用データ生
成装置の構築に寄与する。このような文字化け検査用デ
ータ生成のためのプログラムは、例えば、文書編集や組
版のためのソフトウエアに、ユーティリティソフトウエ
アの一つとして組み込むこともできる。
This garbled inspection data generation device is a computer system in which a program describing the functions of the character type extraction unit 10 and the inspection data generation unit 16 is loaded onto a memory, and the CPU executes the program. Can be constructed by Character type list 12
Is constructed in a work area secured on a memory, for example. As the candidate information table 14, a table created by a user or the like in advance is loaded on a memory, for example, so that the program can be referred to. Such program or table data is provided in a state stored in a medium. As a medium storing a program or the like, for example, a flexible disk, a CD-ROM, a memory card, or the like can be used. The program and data recorded on the medium are installed in a storage device incorporated in the computer system, for example, a hard disk device, and are executed to execute the program and realize the garbled character check for realizing each function described in the present embodiment. Contributes to the construction of a data generation device. Such a program for generating garbled character inspection data can be incorporated into software for document editing and typesetting, for example, as one of utility software.

【0026】次に、図2の装置による文字化け検査用デ
ータの生成処理の手順を詳細に説明する。
Next, the procedure of the process for generating garbled character inspection data by the apparatus shown in FIG. 2 will be described in detail.

【0027】図4は、以下の説明において具体例として
用いる文書を示す。図4は、図3の文書を印刷するため
のPDLの文書ファイル、すなわち図2における文書フ
ァイル100の一例を示している。この例は、PDLと
してPostScriptを用いた場合の例であり、繁
雑さを避けるために一部を省略している。
FIG. 4 shows a document used as a specific example in the following description. FIG. 4 shows an example of a PDL document file for printing the document shown in FIG. 3, that is, an example of the document file 100 shown in FIG. This example is an example of a case where PostScript is used as PDL, and a part thereof is omitted to avoid complexity.

【0028】図4では、右欄に図3の文書を表すPDL
の記述を順に示し、左欄にPDL記述の意味、例えば文
書における対応する文字など、を示した。例えば、1行
目の“/FONT−A・・・”などはフォント指定のた
めの記述であり、“FONT−A”はフォント名、“f
f”はフォント名に対応するフォントを読み込むオペレ
ータ、“[7 0 ・・]”はフォントに対する座標変
換を表すマトリクス(サイズの変換などのために用い
る)、“mf”はフォントに対して前記マトリクスを適
用することにより新しいフォントを生成するオペレー
タ、“setf”はフォントを文字描画用のフォントと
してセットするオペレータである。したがって、文書フ
ァイルの1行目の記述は、フォント名が“FONT−
A”であるフォントをロードし、このフォントを指定さ
れたマトリクスにて変換し、この結果生成されたフォン
トを文字描画用のフォントとしてセットすることを表
す。フォント指定は、次のフォント指定がなされるまで
有効である。
In FIG. 4, a PDL representing the document of FIG.
Are described in order, and the meaning of the PDL description, for example, the corresponding character in the document, is shown in the left column. For example, “/ FONT-A...” On the first line is a description for specifying a font, “FONT-A” is a font name, “f
"f" is an operator for reading the font corresponding to the font name, "[70 ..]" is a matrix representing coordinate conversion for the font (used for size conversion, etc.), and "mf" is the matrix for the font. Is applied to generate a new font, and "setf" is an operator that sets the font as a font for drawing characters.
A indicates that a font "A" is loaded, the font is converted by a specified matrix, and the font generated as a result is set as a font for character drawing. The font specification is as follows. It is effective until

【0029】また、文書ファイルの2行目及び3行目
は、図3の文書における文字「サ」の描画を指示する記
述である。ここで、2行目において、“−0 7”は座
標、“lcmt”はその座標を描画の基準位置にセット
するオペレータである。3行目において、“\203
T”は「サ」を示す文字コードであり、“sh”はその
文字コードの文字をその時点で有効なフォントを用いて
描画するオペレータである。従って、文書ファイルの2
行目及び3行目の記述によれば、2行目に指定された座
標を基準位置として、3行目で指定された文字コードの
文字「サ」が、フォント“FONT−A”(1行目で設
定)で描画される。以下、4及び5行目の記述で文字
「ン」、6及び7行目の記述で文字「プ」といった具合
に、位置指定と文字コード指定の2行一組で1つの文字
についての描画指示を表す。
The second and third lines of the document file are descriptions for instructing drawing of the character "S" in the document of FIG. Here, in the second line, “−07” is a coordinate, and “lcmt” is an operator who sets the coordinate to a drawing reference position. In the third line, “$ 203
“T” is a character code indicating “sa”, and “sh” is an operator that draws a character of the character code using a font valid at that time. Therefore, 2 of the document file
According to the description on the third line and the third line, the character “sa” of the character code specified on the third line is set to the font “FONT-A” (first line) with the coordinates specified on the second line as a reference position. Drawn by eye). Hereinafter, a drawing instruction for one character is given in a pair of position designation and character code designation, such as the character "n" in the description of the fourth and fifth lines, and the character "p" in the description of the sixth and seventh lines. Represents

【0030】図2の文字化け検査用データ生成装置にお
いて、文字種抽出部10は、このような文書ファイルの
PDL記述を先頭行から順に読み込んで解釈し、文書の
各文字の文字種を特定し、文字化け検査が必要な文字種
を抽出していく。なお、本実施形態では、文字種は、前
述したようにフォントと文字コードの組み合わせで特定
する。
In the garbled character inspection data generating apparatus of FIG. 2, the character type extracting unit 10 reads and interprets the PDL description of such a document file in order from the first line, specifies the character type of each character of the document, and Character types that require garbled inspection are extracted. In the present embodiment, the character type is specified by the combination of the font and the character code as described above.

【0031】また図5は、図2における候補情報テーブ
ル14の内容の一例を概念的に示したものである。実際
の候補情報テーブル14は、同様の内容をコンピュータ
で読み取り可能な形式で記述したものとなる。図5の例
では、文字化け検査が不要なフォントのフォント名が欄
300に、文字化け検査が不要な文字コードの範囲が欄
302に、文字化け検査が必要な文字コードの範囲が欄
304に、それぞれ登録されている。検査不要のフォン
トとしては、例えば文書作成環境及び印刷環境の両方に
インストールされ、文字化けがないことが分かっている
ものなどが考えられる。文字化け検査が不要な文字コー
ドとしては、例えばJISの第1水準や第2水準など、
フォントメーカー間で統一されている文字コードが考え
られる。図5の例ではその様な統一された文字コードの
範囲が、検査不要の文字コード範囲として、JIS区点
コードの形で登録されている(01区から10区、及び
16区〜83区)。本実施形態では、文字コード範囲に
該当する文字種は、基本的に文字化けの検査対象から外
す。ただし、JISの第1水準や第2水準のコードの範
囲内でも、例えば02区26点〜02区末尾や08区0
1点〜08区末尾などのように対応文字が未定義の範囲
があり、このような範囲の文字コードは各フォントメー
カーが自由に利用できる。このため、このようなJIS
に未定義の範囲の文字コードには、フォントごとに異な
った文字が割り当てられている可能性が高く、文字化け
の可能性がある。そこで、図5では、このような範囲
が、文字化け検査が不要な文字コード範囲の中の例外と
して、文字化け検査が必要な文字コード範囲の欄304
に登録されている。また、JISの新旧規格間で文字の
形が異なっている文字コード(例えば22区38点)も
あり、そのような文字コードも文字化け検査が必要な文
字コード範囲の欄304に登録されている。図5では、
文字コードがJIS区点コードで表されているが、文字
種抽出部10は、これをPDLが採用する例えば8進あ
るいは16進などのコード表現に変換して解釈する。こ
れら候補情報テーブル14の登録情報は、各文字種が文
字化け検査対象か否かを判定する際の判定条件として用
いられる。これら判定条件の適用の仕方については、後
述する具体的な処理手順の説明において詳しく述べる。
なお、候補情報テーブル14は、ユーザやシステム管理
者が予めエディタなどを用いて作成しておく。
FIG. 5 conceptually shows an example of the contents of the candidate information table 14 in FIG. The actual candidate information table 14 describes the same contents in a computer-readable format. In the example of FIG. 5, the font name of the font that does not require garbled inspection is in column 300, the range of character codes that do not require garbled inspection is in column 302, and the range of character codes that require garbled inspection is in column 304. , Each is registered. As the font that does not need to be inspected, for example, a font that is installed in both the document creation environment and the printing environment and is known to have no garbled characters can be considered. Character codes that do not require a garbled check include, for example, JIS first and second standards.
Character codes that are unified among font makers are conceivable. In the example of FIG. 5, such a unified character code range is registered as a character code range that does not need to be inspected in the form of a JIS Kuten code (from Ward 01 to Ward 10, and Ward 16 to Ward 83). . In the present embodiment, the character type corresponding to the character code range is basically excluded from the inspection target for garbled characters. However, even within the range of the JIS first-level and second-level codes, for example, 26 points in 02 section to the end of 02 section or 0 section in 08 section
There is a range in which the corresponding character is undefined, such as from one point to the end of the 08th section, and character codes in such a range can be freely used by each font maker. Therefore, such JIS
It is highly probable that different characters are assigned to the character codes in the undefined range for each font, resulting in garbled characters. Therefore, in FIG. 5, such a range is an exception in the character code range where the garbled character inspection is not required.
Registered in. There are also character codes (for example, 22 sections and 38 points) whose character shapes are different between the old and new standards of JIS, and such character codes are also registered in the character code range field 304 requiring a garbled character inspection. . In FIG.
Although the character code is represented by a JIS punctuation code, the character type extraction unit 10 interprets the character code by converting it into a code expression such as octal or hexadecimal adopted by the PDL. The registration information in the candidate information table 14 is used as a determination condition when determining whether each character type is a garbled test target. How to apply these determination conditions will be described in detail in the following description of specific processing procedures.
The candidate information table 14 is created in advance by a user or a system administrator using an editor or the like.

【0032】以上説明した文書(図3及び図4)と候補
情報テーブル(図5)を具体例として、図2の装置によ
る文字化け検査用データの生成処理の手順を説明する。
図6は、この手順を示すフローチャートである。図6の
手順のうち、S202からS220までのステップは文
字種抽出部10で実行される手順を示し、S222から
S238までのステップは検査用データ生成部16によ
って実行される手順を示す。以下、図2〜図6を適宜参
照して説明する。
Using the above-described document (FIGS. 3 and 4) and the candidate information table (FIG. 5) as specific examples, a description will be given of the procedure of processing for generating garbled inspection data by the apparatus shown in FIG.
FIG. 6 is a flowchart showing this procedure. 6, steps from S202 to S220 indicate procedures performed by the character type extraction unit 10, and steps from S222 to S238 indicate procedures performed by the inspection data generation unit 16. Hereinafter, description will be made with reference to FIGS.

【0033】文字化け検査用データ生成装置にPDLの
文書ファイル100が与えられ、検査用データの生成処
理の指示が入力されると、まず文字種抽出部10は、処
理対象文字の順番を表すカウント値nを1に初期化する
(S202)。なお、文字種抽出部10は、このカウン
ト値nを管理するほか、現在の処理対象の文字を表すデ
ータ構造として、現時点で有効なフォントのフォント名
を表す文字列データと、当該文字の文字コードを表す8
進あるいは16進の整数値データと、を含む構造体を管
理している。この構造体を、以下「処理対象文字デー
タ」と呼ぶ。次に、文字種抽出部10は、文書ファイル
を順に読み取っていき、第n番目の文字のデータを取り
出す(S204)。ここで、文字種抽出部10は、例え
ば“sh”オペレータを文字の区切りとして、1文字ず
つのデータを判別する。S204では、取り出した文字
のデータからフォント名及び文字コードを切り出し、そ
れらを処理対象文字データにセットする。なお、文字の
データにフォント指定が含まれない場合は、処理対象文
字データのフォント名は変更されない。このようにして
文書ファイルから処理対象文字のデータが取り込まれる
と、次に、その処理対象文字のフォント名が、候補情報
テーブル14に登録された検査不要のフォント名に該当
するか否かを判定する(S206)。検査不要のフォン
トに該当する場合には、その文字は文字化け検査対象と
して抽出する必要はないと判断する。そして、文書ファ
イルの末尾に達したか否かを判定し(S218)、達し
ていない場合はカウント値nを1進めて(S220)次
の文字の処理に移行する。
When the PDL document file 100 is provided to the garbled test data generating apparatus and an instruction for the process of generating test data is input, first, the character type extracting unit 10 counts the count value indicating the order of the character to be processed. n is initialized to 1 (S202). The character type extraction unit 10 manages the count value n, and also stores character string data representing the font name of the currently valid font and the character code of the character as a data structure representing the current character to be processed. 8 to represent
And a hexadecimal or hexadecimal integer value data. This structure is hereinafter referred to as “character data to be processed”. Next, the character type extraction unit 10 sequentially reads the document file and extracts data of the n-th character (S204). Here, the character type extraction unit 10 determines data for each character by using, for example, an “sh” operator as a character delimiter. In S204, a font name and a character code are cut out from the extracted character data, and these are set as processing target character data. If the font data is not included in the character data, the font name of the character data to be processed is not changed. When the data of the character to be processed is fetched from the document file in this way, it is next determined whether or not the font name of the character to be processed corresponds to the font name which does not need to be checked registered in the candidate information table 14. (S206). If the font does not need to be checked, it is determined that the character does not need to be extracted as a garbled check target. Then, it is determined whether or not the end of the document file has been reached (S218). If the end has not been reached, the count value n is incremented by 1 (S220), and the process proceeds to the next character.

【0034】S206の判定で、検査不要のフォントで
ないと判定された場合は、その処理対象文字の文字コー
ドが、候補情報テーブル14に登録された検査不要な文
字コード範囲に含まれるか否かを判定する(S20
8)。文字コードが検査不要な文字コード範囲に含まれ
る場合は、さらにその文字コードが、その範囲内でも例
外的に検査が必要な文字コードに該当するか否かを調べ
る(S210)。この結果、そのような例外には該当し
ないと判定された場合に、その処理対象文字は文字化け
検査対象として抽出する必要はないと判断する。そし
て、文書の末尾に達したか否かを判定し(S218)、
達していない場合はカウント値nを1進めて(S22
0)次の文字の処理に移行する。
If it is determined in S206 that the font is not a font requiring no inspection, it is determined whether or not the character code of the character to be processed is included in the character code range not requiring inspection registered in the candidate information table 14. Judgment (S20
8). If the character code is included in the character code range that does not need to be checked, it is further determined whether or not the character code falls within the character code that needs to be checked exceptionally even within the range (S210). As a result, if it is determined that the exception does not correspond to such an exception, it is determined that the processing target character does not need to be extracted as a garbled inspection target. Then, it is determined whether or not the end of the document has been reached (S218),
If not reached, the count value n is advanced by 1 (S22
0) Move to the processing of the next character.

【0035】S208の判定で検査が不要な文字コード
範囲に含まれないと判定された場合、あるいはS210
で検査が必要な文字コードに該当すると判定された場合
は、当該処理対象文字は文字化け検査対象と判断され、
当該処理対象文字のフォント名及び文字コードを文字種
リスト12に登録する。ただし、本実施形態では、文字
種リスト12に同じ文字種が重複して登録されることを
避けるために、処理対象文字のフォント名及び文字コー
ドを、その時点での文字種リスト12の各エントリと比
較し(S212)、同一文字種が既に文字種リスト12
に登録されているか否かを調べる(S214)。この結
果、処理対象文字が文字種リスト12に未登録と判定さ
れた場合は、その処理対象文字のフォント名及び文字コ
ードの組を文字種リスト12に登録する(S216)。
S214にて、同一文字種が既に登録されていると判定
された場合には、その処理対象文字は文字種リスト12
に登録しない。そして、いずれの場合にも、文書ファイ
ルの末尾に達したか否かを判定し(S218)、達して
いない場合はカウント値nを1進めて(S220)次の
文字の処理に移行する。
If it is determined in step S208 that the character code is not included in the character code range for which the inspection is unnecessary,
If it is determined that the corresponding to the character code that needs to be inspected, the processing target character is determined to be a garbled inspection target,
The font name and character code of the character to be processed are registered in the character type list 12. However, in the present embodiment, in order to prevent the same character type from being registered in the character type list 12 repeatedly, the font name and the character code of the character to be processed are compared with each entry of the character type list 12 at that time. (S212) The same character type is already in the character type list 12
It is checked whether or not it is registered in (S214). As a result, when it is determined that the character to be processed is not registered in the character type list 12, the combination of the font name and the character code of the character to be processed is registered in the character type list 12 (S216).
If it is determined in S214 that the same character type has already been registered, the target character is the character type list 12
Do not register with. In either case, it is determined whether or not the end of the document file has been reached (S218). If not, the count value n is incremented by 1 (S220), and the process proceeds to the processing of the next character.

【0036】以上の手順を文書ファイルの末尾に達する
まで繰り返すことにより、文書ファイルから文字化け検
査対象に該当するすべての文字種を抽出することができ
る。
By repeating the above procedure until the end of the document file is reached, it is possible to extract all the character types corresponding to the garbled character inspection target from the document file.

【0037】図7は、図4に示した文書ファイルを、図
5に示した候補情報テーブルを用いて上記手順に従って
処理したときに得られる文字種リスト12のデータ内容
を示している。図7では、分かりやすくするために文字
コードの欄には対応する文字自体を示しているが、実際
のデータでは整数値のコードが登録される。
FIG. 7 shows the data content of the character type list 12 obtained when the document file shown in FIG. 4 is processed according to the above-described procedure using the candidate information table shown in FIG. In FIG. 7, the corresponding character itself is shown in the character code column for easy understanding, but an integer code is registered in actual data.

【0038】このようにして文書ファイルから検査対象
文字種の抽出が完了すると、次に検査用データ生成部1
6が、文字種リスト12の各文字種データを所定の順序
にしたがってソートする(S222)。本実施形態で
は、まずフォント名に基づいて各文字種データをフォン
トごとに集めて整理し、その後各フォントごとについて
各文字種データを文字コードの例えば昇順に従って並べ
替える。
When the extraction of the character type to be inspected from the document file is completed in this way, the inspection data generation unit 1
6 sorts each character type data of the character type list 12 in a predetermined order (S222). In this embodiment, first, each character type data is collected and arranged for each font based on the font name, and then each character type data is rearranged for each font in the ascending order of the character codes, for example.

【0039】そして、検査用データ生成部16は、この
ソートされた文字種リスト12に基づき、以下のように
して検査用データファイル200を生成する。すなわ
ち、まずカウント値kを1に初期化する(S224)。
次に、文字種リスト12から第k文字のデータ(すなわ
ちフォント名と文字コード)を取り出す(S226)。
そして、カウント値kの値が1か否かを判定し(S22
8)、k=1の場合にはその文字(すなわち文字種リス
トの1番目の文字)のフォント名を表す文字列を印刷す
るためのPDL記述を生成し、検査用データファイル2
00に書き込む(S232)。また、S228にてkが
1でない場合は、その文字(すなわち第k文字)と一つ
前の文字(すなわち第(k−1)文字)のフォント名を
比較し(S230)、両者が一致しない場合は、その第
k文字のフォント名を印刷するためのPDL記述を生成
し、検査用データファイル200に書き込む(S23
2)。そして、フォント名の書き込みが終わると、次に
その第k文字の文字コードに基づきその文字を印刷する
ためのPDL記述を生成し、検査用データファイル20
0に書き込む(S234)。一方、S230の判定にて
第k文字のフォントが第(k−1)文字のフォントと同
じであった場合には、検査用データファイル200への
フォント名の書き込みは行わず、その第k文字を印刷す
るためのPDL記述を検査用データファイル200に出
力する(S234)。なお、S232及びS234で
は、検査用データ生成部16は、スタイル情報18を参
照して文字サイズなど必要なスタイルを決定し、そのス
タイルに基づきPDL記述を生成する。このS228〜
S234の処理によれば、1つのフォントに属する文字
のうちの先頭の文字を文字種リスト12から読み込んだ
ときに、そのフォントのフォント名のPDL記述が書き
込まれることになる。これにより、各フォントごとに、
フォント名とそのフォントに属する検査対象の文字とが
並んだ印刷結果を得ることができる。このような表示に
よれば、文字化けの検査の際に、文字化けが生じたフォ
ントの識別が容易となる。
Then, the inspection data generation unit 16 generates an inspection data file 200 based on the sorted character type list 12 as follows. That is, first, the count value k is initialized to 1 (S224).
Next, data of the k-th character (that is, font name and character code) is extracted from the character type list 12 (S226).
Then, it is determined whether the value of the count value k is 1 (S22).
8) If k = 1, generate a PDL description for printing a character string representing the font name of the character (that is, the first character in the character type list),
00 is written (S232). If k is not 1 in S228, the font name of the character (that is, the k-th character) is compared with the font name of the immediately preceding character (that is, the (k-1) th character) (S230), and the two do not match. In this case, a PDL description for printing the font name of the k-th character is generated and written in the inspection data file 200 (S23).
2). When the writing of the font name is completed, a PDL description for printing the k-th character is generated based on the character code of the k-th character.
0 is written (S234). On the other hand, if the font of the k-th character is the same as the font of the (k-1) -th character in the determination in S230, the font name is not written in the inspection data file 200, and the k-th character is not written. Is output to the inspection data file 200 (S234). In S232 and S234, the inspection data generation unit 16 determines a required style such as a character size with reference to the style information 18, and generates a PDL description based on the style. This S228-
According to the process of S234, when the first character among the characters belonging to one font is read from the character type list 12, the PDL description of the font name of the font is written. With this, for each font,
A print result in which the font name and the characters to be inspected belonging to the font are arranged can be obtained. According to such a display, it is easy to identify the font in which the garbled character has occurred when the garbled character is inspected.

【0040】そして、S234の処理が終わると、文字
種リスト12の末尾に達したか否かを判定し(S23
6)、達していない場合はカウント値kを1進め(S2
38)、S226に戻って上記の処理を繰り返す。この
ような処理を文字種リスト12の最後まで繰り返すこと
により、フォントごとに整理された検査対象の文字の一
覧を表示するためのデータからなる検査用データファイ
ル200が得られる。
When the process of S234 is completed, it is determined whether the end of the character type list 12 has been reached (S23).
6) If not, the count value k is incremented by 1 (S2
38), returning to S226, and repeating the above processing. By repeating such processing until the end of the character type list 12, an inspection data file 200 including data for displaying a list of characters to be inspected arranged for each font is obtained.

【0041】図8に、このようにして得られた検査用デ
ータファイル200のPDL記述の一例を示す。この例
は、図4の文書ファイルから生成されたデータである。
図8においては、例えば“FONT−B”というフォン
ト名を示す文字列に対応するPDL記述のあとに、その
FONT−Bに属する検査対象の文字に対応するPDL
記述が続いている。そして、図8の検査用データを印刷
装置に入力すれば、図9に示す印刷結果を得ることがで
きる。
FIG. 8 shows an example of the PDL description of the inspection data file 200 obtained as described above. This example is data generated from the document file of FIG.
In FIG. 8, for example, after a PDL description corresponding to a character string indicating a font name “FONT-B”, a PDL corresponding to a character to be inspected belonging to the FONT-B
The description continues. Then, if the inspection data in FIG. 8 is input to the printing apparatus, the print result shown in FIG. 9 can be obtained.

【0042】以上、本実施形態に置ける検査用データフ
ァイル200の作成手順を説明した。上記の手順に従っ
て得られた検査用データファイル200は、記録媒体2
02に格納されて印刷側に送られると共に、紙に印刷さ
れた検査用シート204の形でも印刷側に送られる。印
刷側では、この検査用データファイル200を印刷装置
に供給して紙に印刷し、その印刷結果を検査用シート2
04と比較することにより、文書作成側と印刷側との間
での文字化けを検査することができる。
The procedure for creating the inspection data file 200 according to the present embodiment has been described above. The inspection data file 200 obtained according to the above procedure is stored in the recording medium 2
02 and sent to the printing side, and also sent to the printing side in the form of an inspection sheet 204 printed on paper. On the printing side, the inspection data file 200 is supplied to a printing device and printed on paper, and the printing result is printed on the inspection sheet 2.
By comparing this with 04, garbled characters between the document creating side and the printing side can be inspected.

【0043】以上説明したように、本実施形態によれ
ば、候補情報テーブル14に登録された条件から決定さ
れる検査対象の文字種のみが、印刷対象の文書ファイル
100から重複なく抽出される。このようにして抽出さ
れた文字種のみを文書作成側及び印刷側の両方で印刷
し、その印刷結果を比較することにより、文書作成側と
印刷側との間での文字化けの有無を検査することができ
る。本実施形態では、文字化けの起こる可能性が高い文
字だけを抽出して検査を行うので、文字化け検査に要す
る時間・労力を大幅に節約することができる。
As described above, according to the present embodiment, only the character type to be inspected determined from the conditions registered in the candidate information table 14 is extracted from the document file 100 to be printed without duplication. Inspect the document creation side and the printing side for garbled characters by printing only the character types extracted in this way on both the document creation side and the printing side, and comparing the printing results. Can be. In the present embodiment, since only characters having a high possibility of occurrence of garbled characters are extracted and inspected, the time and labor required for garbled character inspection can be greatly reduced.

【0044】なお、本実施形態に置いて、候補情報テー
ブル14に登録される情報は図5のような形式のものに
限られるものではなく、検査すべき文字種を特定できる
ものであればどのような形式でもよい。例えば、検査す
べき文字種を表すフォント名や文字コード、あるいはそ
れらの組合わせを列挙して登録したものを用いることも
できる。
In the present embodiment, the information registered in the candidate information table 14 is not limited to the format shown in FIG. 5, but may be any information that can specify the character type to be inspected. Format may be used. For example, a font name and a character code representing a character type to be inspected, or a combination of those listed and registered may be used.

【0045】また、ユーザが、文書編集ソフトウエアを
用い、文字化け検査をしたい文字種の一覧を示した文書
を通常の文書編集・作成と同様の方法で作成し、この文
書から候補情報テーブル14を自動生成することもでき
る。この場合、候補情報テーブル生成のツールが、ユー
ザの作成した文書からフォント名と文字コードとを抽出
し、これらの情報を候補情報テーブル14に登録してい
く。この方法によれば、ユーザが適宜候補情報テーブル
14をカスタマイズすることが可能となる。
Further, the user creates a document showing a list of character types to be inspected for garbled characters by using the document editing software in the same manner as in ordinary document editing / creation, and creates a candidate information table 14 from this document. It can be automatically generated. In this case, the candidate information table generation tool extracts a font name and a character code from the document created by the user, and registers the information in the candidate information table 14. According to this method, the user can appropriately customize the candidate information table 14.

【0046】なお、候補情報テーブル14の利用は、必
ずしも本発明にとって必須ではない。図10は、候補情
報テーブルを用いない場合の検査用データの作成処理の
手順、特に文字種抽出部10の処理手順を示すフローチ
ャートである。図10の方法では、検査用データの作成
指示が入力されると、文字種抽出部10は、カウント値
nを1に初期化し(S240)、文書ファイルから第n
文字を取り出す(S242)。上述の実施形態では、こ
のあと候補情報テーブル14を用いて検査対象の絞り込
みを行っていたが、この方法ではそのような絞り込みは
行わずに、その第n文字を文字種リスト12の登録デー
タと比較し(S244)、その文字が文字種リスト12
に既登録であるか否かだけを調べる(S246)。そし
て、その文字が未登録であれば、文字種リスト12に新
たに登録する(S248)。そして、以上の処理を文書
ファイルの末尾まで繰り返す(S250,S252)。
このような処理により、文書ファイルに含まれるすべて
の文字種が文字種リスト12に抽出される。以下、検査
用データ生成部16は、図6のS222以降の処理を行
い、文字種リスト12の情報から検査用データを作成す
る。このように、候補情報テーブルによる検査対象の絞
り込みを行なわず、文書ファイルに含まれる互いに異な
る文字種を抽出し、その一覧の印刷結果を用いて文字化
けを検査するという方法でも、文書の全文の印刷結果を
用いて文字化けを検査する場合よりも、文字化けのチェ
ックの労力・時間をはるかに低減することができる。
The use of the candidate information table 14 is not necessarily essential to the present invention. FIG. 10 is a flowchart illustrating the procedure of the inspection data creation process when the candidate information table is not used, in particular, the process procedure of the character type extraction unit 10. In the method of FIG. 10, when an instruction to create inspection data is input, the character type extraction unit 10 initializes the count value n to 1 (S240), and reads the n-th file from the document file.
Characters are extracted (S242). In the above-described embodiment, the inspection target is narrowed down by using the candidate information table 14 thereafter. In this method, the n-th character is compared with the registered data of the character type list 12 without performing such narrowing-down. (S244), and the character is the character type list 12
It is checked only whether or not the information has already been registered (S246). If the character is not registered, the character is newly registered in the character type list 12 (S248). Then, the above processing is repeated until the end of the document file (S250, S252).
By such processing, all character types included in the document file are extracted to the character type list 12. Hereinafter, the inspection data generation unit 16 performs the processing from S222 in FIG. 6 and creates inspection data from the information of the character type list 12. As described above, the method of extracting the different character types included in the document file without narrowing down the inspection target by the candidate information table and inspecting the garbled character by using the print result of the list also prints the full text of the document. Compared with the case where garbled characters are inspected using the result, the labor and time for checking garbled characters can be significantly reduced.

【0047】また、上記実施形態では、フォント名と文
字コードの組合わせにより文字種を特定したが、文字種
の特定の仕方はこれに限らない。例えば、フォント名、
文字コード以外に、文字サイズなど文字の他の属性も含
んだ組合わせにて文字種を特定してもよい。
In the above embodiment, the character type is specified by the combination of the font name and the character code. However, the method of specifying the character type is not limited to this. For example, font name,
In addition to the character code, the character type may be specified by a combination including other attributes of the character such as the character size.

【0048】また、上記実施形態において、検査用シー
トなどにおける検査対象の各文字の印刷サイズを、実際
の文書の印刷の場合と同じ大きさとすれば、ユーザは実
際の印刷状態に近い形の印刷結果に基づき文字化けの検
査を行うことができる。このためには、文書ファイルか
ら文字を抽出する際に、フォント名や文字コードだけで
なく、文字サイズの情報も抽出し、検査用データを作成
する際に、その文字サイズの情報を反映したPDL記述
を生成すればよい。
In the above-described embodiment, if the print size of each character to be inspected on an inspection sheet or the like is set to the same size as when printing an actual document, the user can print in a form close to the actual printing state. Inspection of garbled characters can be performed based on the result. For this purpose, when extracting characters from a document file, not only font names and character codes, but also character size information is extracted, and when creating inspection data, a PDL reflecting the character size information is used. You only need to generate a description.

【0049】また、文字化け検査用の検査用データの応
用方法として次のようなものも考えられる。すなわち、
一般にDTPシステムなどで文書を作成した場合には、
図1のS14〜S18のように、ディスプレイの表示と
印刷結果とを照合して正しい印刷結果が得られているか
を確認するが、このような確認作業に検査用データを適
用することにより、作業効率を改善することができる。
この方法では、作成した検査用データをディスプレイに
表示すると共にプリンタにて印刷し、ディスプレイ表示
と印刷結果とを比較して、ディスプレイ表示と印刷結果
との間での文字化けをチェックする。この方法によれ
ば、文書作成環境におけるディスプレイ表示と印刷結果
との間での文字化けの検査にかかる労力、時間を節約す
ることができる。
The following method can be considered as an application method of the inspection data for the garbled inspection. That is,
Generally, when a document is created using a DTP system,
As shown in S14 to S18 in FIG. 1, the display display is compared with the print result to check whether a correct print result is obtained. By applying the inspection data to such a check operation, the work is performed. Efficiency can be improved.
In this method, the created inspection data is displayed on a display and printed by a printer, and the display display is compared with the print result to check for garbled characters between the display display and the print result. According to this method, it is possible to save labor and time required to check for garbled characters between the display display and the print result in the document creation environment.

【0050】また、本発明は、PDLで記述された文書
ファイルだけでなく、その他のデータ形式で表された文
書ファイルにも適用可能である。
The present invention is applicable not only to a document file described in PDL, but also to a document file represented in another data format.

【0051】また、検査用データファイル200の印刷
環境への伝達は、記録媒体を介することなく、例えばデ
ータ通信にて行ってもよい。
The transmission of the inspection data file 200 to the printing environment may be performed by, for example, data communication without using a recording medium.

【0052】[0052]

【発明の効果】以上説明したように、本発明によれば、
印刷対象の文書から互いに異なる文字だけ、あるいは文
字化けの可能性がある検査対象文字種だけを抽出し、こ
れら抽出された文字種の印刷結果を比較することにより
文字化けの検査を行うので、文書の全文の印刷結果を用
いて文字化けを検査する場合よりも、文字化けのチェッ
クの労力・時間をはるかに低減することができる。
As described above, according to the present invention,
Since only characters that are different from each other or character types that are likely to be garbled are extracted from the document to be printed and garbled characters are checked by comparing the print results of these extracted character types, the full text of the document is checked. The labor and time required to check for garbled characters can be significantly reduced as compared with the case where garbled characters are inspected using the print result of (1).

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明に係る文字化け検査方法の全体の流れ
を示すフローチャートである。
FIG. 1 is a flowchart showing an entire flow of a garbled character inspection method according to the present invention.

【図2】 本発明に係る文字化け検査用データ生成装置
の構成を示す機能ブロック図である。
FIG. 2 is a functional block diagram showing a configuration of a garbled character inspection data generation device according to the present invention.

【図3】 印刷対象の文書の一例を示す図である。FIG. 3 is a diagram illustrating an example of a document to be printed.

【図4】 図4の文書を表すページ記述言語(PDL)
の記述例を示す図である。
FIG. 4 is a page description language (PDL) representing the document of FIG.
It is a figure showing the example of description of.

【図5】 候補情報テーブルの内容の一例を示す図であ
る。
FIG. 5 is a diagram showing an example of the contents of a candidate information table.

【図6】 文字化け検査用データ生成装置の処理手順を
示すフローチャートである。
FIG. 6 is a flowchart illustrating a processing procedure of the garbled inspection data generation device.

【図7】 文字種リストのデータ内容を示す図である。FIG. 7 is a diagram showing data contents of a character type list.

【図8】 検査用データファイルの記述例を示す図であ
る。
FIG. 8 is a diagram illustrating a description example of an inspection data file.

【図9】 図8の検査用データファイルの印刷例を示す
図である。
FIG. 9 is a diagram illustrating a print example of the inspection data file of FIG. 8;

【図10】 候補情報テーブルを用いない場合の検査用
データの作成処理の手順の要部を示すフローチャートで
ある。
FIG. 10 is a flowchart illustrating a main part of a procedure of a process of creating inspection data when a candidate information table is not used.

【符号の説明】[Explanation of symbols]

10 文字種抽出部、12 文字種リスト、14 候補
情報テーブル、16検査用データ生成部、18 スタイ
ル情報、100 文書ファイル、200 検査用データ
ファイル、202 記録媒体、204 検査用シート。
10 character type extraction unit, 12 character type list, 14 candidate information table, 16 inspection data generation unit, 18 style information, 100 document file, 200 inspection data file, 202 recording medium, 204 inspection sheet.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 第1の情報処理環境で作成した文書を第
2の情報処理環境で印刷する際の文字化けを検査する方
法であって、 前記第1の情報処理環境にて、作成した文書に含まれる
互いに異なる文字種を抽出して検査用データを作成し、
この検査用データを印刷し、 前記検査用データ及びその印刷結果を前記第2の情報処
理環境に伝達し、 前記第2の情報処理環境にて、伝達された前記検査用デ
ータを印刷し、この印刷結果を前記第1の情報処理環境
における印刷結果と比較することにより文字化けを検査
することを特徴とする文字化け検査方法。
1. A method for inspecting a garbled character when a document created in a first information processing environment is printed in a second information processing environment, the document created in the first information processing environment. Extract the different character types included in the to create inspection data,
Printing the inspection data, transmitting the inspection data and a print result thereof to the second information processing environment, and printing the transmitted inspection data in the second information processing environment; A garbled character inspection method, wherein garbled character inspection is performed by comparing a print result with a print result in the first information processing environment.
【請求項2】 第1の情報処理環境で作成した文書を第
2の情報処理環境で印刷する際の文字化けを検査する方
法であって、 前記第1の情報処理環境にて、作成した文書から所定の
検査対象文字種に含まれる文字種を抽出して検査用デー
タを作成し、この検査用データを印刷し、 前記検査用データ及びその印刷結果を前記第2の情報処
理環境に伝達し、 前記第2の情報処理環境にて、伝達された前記検査用デ
ータを印刷し、この印刷結果を前記第1の情報処理環境
における印刷結果と比較することにより文字化けを検査
することを特徴とする文字化け検査方法。
2. A method for inspecting garbled characters when a document created in a first information processing environment is printed in a second information processing environment, the document created in the first information processing environment. Extracting a character type included in a predetermined character type to be inspected from to generate inspection data, printing the inspection data, transmitting the inspection data and a print result thereof to the second information processing environment, In the second information processing environment, the transmitted inspection data is printed, and the garbled character is inspected by comparing the print result with the print result in the first information processing environment. Garbage inspection method.
【請求項3】 印刷対象の文書データに含まれる互いに
異なる文字種を抽出する文字種抽出手段と、 抽出した文字種のデータに基づき検査用データを生成す
るデータ生成手段と、 を含むことを特徴とする文字化け検査用データ作成装
置。
3. A character comprising: character type extracting means for extracting different character types included in document data to be printed; and data generating means for generating inspection data based on the extracted character type data. A garble inspection data creation device.
【請求項4】 文字化け検査対象文字種を特定するため
の情報が登録された候補情報テーブルと、 印刷対象の文書データから、前記候補情報テーブルの情
報によって特定される検査対象文字種に含まれる文字種
を抽出する文字種抽出手段と、 抽出した文字種のデータに基づき検査用データを生成す
るデータ生成手段と、 を含むことを特徴とする文字化け検査用データ作成装
置。
4. A candidate information table in which information for specifying a garbled inspection target character type is registered, and a character type included in the inspection target character type specified by the information of the candidate information table is determined from document data to be printed. A garbled character inspection data creating device, comprising: a character type extracting means for extracting; and a data generating means for generating inspection data based on the extracted character type data.
【請求項5】 請求項3又は4に記載の装置であって、 前記データ生成手段は、前記抽出した文字種をフォント
ごとに整理して配列することを特徴とする文字化け検査
用データ作成装置。
5. The garbled character inspection data creating device according to claim 3, wherein the data generating means arranges and sorts the extracted character types for each font.
【請求項6】 請求項5記載の装置であって、 前記データ生成手段は、各フォントごとに整理した文字
種の配列に対し、当該配列に対応するフォント名を表す
文字列データを付加する機能を有することを特徴とする
文字化け検査用データ作成装置。
6. The apparatus according to claim 5, wherein the data generating means has a function of adding character string data representing a font name corresponding to the arrangement to an arrangement of character types arranged for each font. A garbled inspection data creating device, characterized by having
【請求項7】 コンピュータを、印刷対象の文書データ
に含まれるすべての文字種を抽出する手段、抽出した文
字種のデータに基づき検査用データを生成する手段とし
て機能させるためのプログラムを記録した記録媒体。
7. A recording medium on which a program for causing a computer to function as means for extracting all character types included in document data to be printed and means for generating inspection data based on the extracted character type data is recorded.
【請求項8】 コンピュータを、文字化け検査の対象文
字種が登録された候補情報テーブルに含まれる文字種を
印刷対象の文書データから抽出する手段、抽出した文字
種のデータに基づき検査用データを生成する手段として
機能させるためのプログラムを記録した記録媒体。
8. A computer for extracting a character type included in a candidate information table in which a garbled character inspection target character type is registered from document data to be printed, and a unit for generating inspection data based on the extracted character type data. A recording medium on which a program for causing a computer to function is recorded.
JP31514596A 1996-11-26 1996-11-26 Garbled character inspection method and garbled character inspection data creation device Expired - Fee Related JP3402971B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31514596A JP3402971B2 (en) 1996-11-26 1996-11-26 Garbled character inspection method and garbled character inspection data creation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31514596A JP3402971B2 (en) 1996-11-26 1996-11-26 Garbled character inspection method and garbled character inspection data creation device

Publications (2)

Publication Number Publication Date
JPH10161825A true JPH10161825A (en) 1998-06-19
JP3402971B2 JP3402971B2 (en) 2003-05-06

Family

ID=18061961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31514596A Expired - Fee Related JP3402971B2 (en) 1996-11-26 1996-11-26 Garbled character inspection method and garbled character inspection data creation device

Country Status (1)

Country Link
JP (1) JP3402971B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152851A (en) * 2007-12-20 2009-07-09 Nec Corp Print inspection system and print inspection method
JP2012108854A (en) * 2009-12-04 2012-06-07 Ricoh Co Ltd Printed matter inspection device, printed matter inspection method, program, memory medium and printed matter inspection system
JP2015214992A (en) * 2014-05-07 2015-12-03 日産自動車株式会社 Fuel gas filling system and fuel gas filling method
US11887389B2 (en) 2020-02-18 2024-01-30 Canon Kabushiki Kaisha Inspection apparatus, inspection method, and non-transitory computer-readable storage medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152851A (en) * 2007-12-20 2009-07-09 Nec Corp Print inspection system and print inspection method
JP2012108854A (en) * 2009-12-04 2012-06-07 Ricoh Co Ltd Printed matter inspection device, printed matter inspection method, program, memory medium and printed matter inspection system
JP2015214992A (en) * 2014-05-07 2015-12-03 日産自動車株式会社 Fuel gas filling system and fuel gas filling method
US11887389B2 (en) 2020-02-18 2024-01-30 Canon Kabushiki Kaisha Inspection apparatus, inspection method, and non-transitory computer-readable storage medium

Also Published As

Publication number Publication date
JP3402971B2 (en) 2003-05-06

Similar Documents

Publication Publication Date Title
US7623710B2 (en) Document content and structure conversion
US9690788B2 (en) File type recognition analysis method and system
US8738415B2 (en) Automated workflow assignment to print jobs
US7408556B2 (en) System and method for using device dependent fonts in a graphical display interface
EP1313032A1 (en) Document conversion
US20040194009A1 (en) Automated understanding, extraction and structured reformatting of information in electronic files
CN101930524B (en) Document information creation device, document registration system and document information creation method
CN109492199B (en) PDF file conversion method based on OCR pre-judgment
CN111680634B (en) Document file processing method, device, computer equipment and storage medium
JP2010510563A (en) Automatic generation of form definitions from hardcopy forms
JPH0798765A (en) Direction-detecting method and image analyzer
CN112084748A (en) Text comparison method
US20030046314A1 (en) Text processing device, text processing method and program therefor
JP7040227B2 (en) Information processing programs, information processing methods, and information processing equipment
JP3402971B2 (en) Garbled character inspection method and garbled character inspection data creation device
US20040091162A1 (en) Run length compression format for storing raster data in a cache
US20080181504A1 (en) Apparatus, method, and program for detecting garbled characters
US20020181779A1 (en) Character and style recognition of scanned text
JP2001101036A (en) Method for storing and using log information
JP2019057137A (en) Information processing apparatus and information processing program
US8775528B2 (en) Computer readable recording medium storing linking keyword automatically extracting program, linking keyword automatically extracting method and apparatus
KR100366657B1 (en) Method of reverse-transforming print output image data to text data file and apparatus therefor
JPH0883280A (en) Document processor
US20070258622A1 (en) Information processing apparatus, information processing method, and information storing medium
CN104412277A (en) Apparatus and method for comparing two files containing graphics elements and text elements

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080229

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees