JP2014013523A - 文書ファイル作成方法およびシステム - Google Patents

文書ファイル作成方法およびシステム Download PDF

Info

Publication number
JP2014013523A
JP2014013523A JP2012151062A JP2012151062A JP2014013523A JP 2014013523 A JP2014013523 A JP 2014013523A JP 2012151062 A JP2012151062 A JP 2012151062A JP 2012151062 A JP2012151062 A JP 2012151062A JP 2014013523 A JP2014013523 A JP 2014013523A
Authority
JP
Japan
Prior art keywords
character
font
data
unicode
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012151062A
Other languages
English (en)
Inventor
So Sekiguchi
創 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2012151062A priority Critical patent/JP2014013523A/ja
Publication of JP2014013523A publication Critical patent/JP2014013523A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】文書ファイルのファイルサイズを削減することが可能な文書ファイル作成方法およびシステムを提供する。
【解決手段】特定コードデータをユニコードデータに変換し、ユニコードデータのフォントを指定する編集を行いユニコード編集済データを生成し、ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データを生成し、全文字データとして抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な文字と、それ以外の文字とに分別し、それ以外の文字に対してはフォントの埋め込みを行う文字として設定し、その設定にしたがってユニコード編集済データを所定文書形式に変換し、文書ファイルを得る文書ファイル作成方法およびその方法を適用したシステム。
【選択図】 図1

Description

本発明は文書ファイルを作成する技術分野に属する。特に、メインフレーム(汎用コンピュータ)において使用される文字コードの体系で記述された原稿データ(元データ)を編集し、パーソナルコンピュータにおいて閲覧可能な文書ファイルを作成する際に、その文書ファイルのファイルサイズを削減することが可能な文書ファイル作成方法およびシステムに関する。
企業の基幹業務システムなどに用いられる大型のコンピュータシステムであるメインフレームにおいて使用される文字コードの体系は、そのメインフレームのメーカー(たとえば、IBM、富士通、日立、NEC)によって独自のものとなっている。すなわち、パーソナルコンピュータにおいて使用される文字コードの体系と相違するものである。日本語文字フォントについても同様であって、メインフレームとパーソナルコンピュータにおいては、フォント(たとえば、明朝体)が同一または類似していても完全に字形(グリフイメージ)が一致するものではない。特に、特定の文字集合(たとえば、JIS規格の文字)に含まれない文字である外字においては字形が一致しないだけでなく、対応する外字が存在しないこともある。
そのメインフレームで作成された原稿データに基づいて文書ファイルを作成した際に、すべての日本語文字フォントについて、用紙へ印刷したときの印刷イメージと、ディスプレイで閲覧したときの表示イメージとを一致させたいことがある。たとえば、銀行での月間取引報告書はダイレクトメールによって顧客に郵送されるが、その郵送とともに、ウェブにおいて閲覧可能な情報として提供し、パーソナルコンピュータにおいてそれをダウンロードすることによって、顧客に閲覧可能とするシステムにおいては、印刷イメージと表示イメージとを一致させることが適当である。また、顧客への電話対応業務を専門に行うコールセンターにおいて、オペレータが送付した印刷物を確認するために、文書ファイルを閲覧するシステムにおいては、郵送した印刷物と同一イメージの閲覧を行えること、たとえば外字を含む氏名を正しい漢字表記で確認できるようにすることが適当である。
用紙へ印刷したときの印刷イメージと、ディスプレイで閲覧したときの表示イメージとを一致させる方法として、文書ファイルにおいて使用される日本語文字フォントの全部を文書ファイルに対して埋め込むデータ処理を行った文書ファイルを作成する方法がある(たとえば、PDF文書ファイルに埋め込む)。このようなデータ処理を行った文書ファイルにおいては、パーソナルコンピュータのディスプレイで表示再現したとき、あるいはそのプリンタで印刷再現したときに、文字化けを起こすことは皆無である。すなわち、銀行の顧客やコールセンターのオペレータは、郵送されている印刷物の印刷イメージと同一のイメージをパーソナルコンピュータを使用して視認することができる。
その一方で、メインフレームにおいて使用する日本語文字フォント(明朝体、ゴシック体、等)は複数存在し、文書ファイルにおいて使用される日本語文字フォントの全部を文書ファイルに対して埋め込むため、文書ファイルのファイルサイズが大きなものとなることが避けられない。そのため、文書ファイルを保存するハードディスクの容量が逼迫する、文書ファイルの閲覧、複写、その他のデータ処理に時間が掛かるという問題が生じることとなる。
そこで、日本語文字フォントを文書ファイルに埋め込む際に、必要最小限の日本語文字フォントを埋め込むことによって文書ファイルのファイルサイズを抑制する発明が公知である(特許文献1)。
特開2006−178622
しかしながら、この特許文献1において開示されている技術は、プリンタドライバーを用いた印刷制御方法および処理方法に関する技術であり、そのままでは、一般的な文書ファイルの編集作業に適用することができないという問題がある。
本発明は上記の問題を解決するために成されたものである。その目的は、メインフレーム(汎用コンピュータ)、等において使用される文字コードの体系で記述された原稿データを編集し、パーソナルコンピュータにおいて閲覧可能な文書ファイルを作成する際に、その文書ファイルのファイルサイズを削減することが可能な文書ファイル作成方法およびシステムを提供することにある。
本発明の請求項1に係る文書ファイル作成方法は、特定コードとユニコードとの対応関係を記述するコード変換テーブルを使用して、特定コードで記述されたテキストデータである特定コードデータから、ユニコードで記述されたテキストデータであるユニコードデータを生成するユニコード変換過程と、前記ユニコードデータに対してすくなくともフォントを指定する編集を行いユニコード編集済データを生成する編集過程と、前記ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データを生成する全文字データ生成過程と、前記全文字データとして抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な第1群フォントに含まれている文字と、拡張文字である第2群フォントに含まれている文字と、外字である第3群フォントに含まれている文字と、に分別する文字分別過程と、前記第2群フォントに含まれている文字と前記第3群フォントに含まれている文字に対してはフォントの埋め込みを行う文字として設定する埋込文字設定過程と、前記埋込文字設定過程における設定にしたがって前記ユニコード編集済データを所定文書形式に変換し文書ファイルを得る文書形式変換過程と、を有するようにしたものである。
本発明の請求項2に係る文書ファイル作成方法は、請求項1に係る文書ファイル作成方法において、前記文字分別過程は、前記第1群フォント、第2群フォント、第3群フォントのいずれにもに含まれない文字を第4群フォントに含まれている文字とする過程であって、前記第4群フォントに含まれている文字に対しては所定コードの文字に置換する設定を行う置換文字設定過程を有し、前記文書形式変換過程は、前記埋込文字設定過程と前記置換文字設定過程における設定にしたがって前記ユニコード編集済データを前記所定文書形式に変換し文書ファイルを得るようにしたものである。
本発明の請求項3に係る文書ファイル作成方法は、請求項1または2に係る文書ファイル作成方法において、前記特定コードはメインフレーム(汎用コンピュータ)において使用されている文字コードの体系のコードであるようにしたものである。
本発明の請求項4に係る文書ファイル作成方法は、請求項1〜3のいずれかに係る文書ファイル作成方法において、前記所定文書形式はPDFであり、前記文書ファイルはPDFファイルであるようにしたものである。
本発明の請求項5に係る文書ファイル作成方法は、請求項2に係る文書ファイル作成方法において、前記所定コードは「スペース」のコードであるようにしたものである。
本発明の請求項6に係る文書ファイル作成方法は、請求項1〜5のいずれかに係る文書ファイル作成方法において、前記第1群フォントはSJIS(Shift JIS)コードのフォントであるようにしたものである。
本発明の請求項7に係る文書ファイル作成方法は、請求項1〜6のいずれかに係る文書ファイル作成方法において、前記第2群フォントと前記第3群フォントのコードはユニコードにおける私用領域(Private Use Area)であるE000〜F8FFのコードであるようにしたものである。
本発明の請求項8に係る文書ファイル作成システムは、特定コードとユニコードとの対応関係を記述するコード変換テーブルを使用して、特定コードで記述されたテキストデータである特定コードデータから、ユニコードで記述されたテキストデータであるユニコードデータを生成するユニコード変換手段と、前記ユニコードデータに対してすくなくともフォントを指定する編集を行いユニコード編集済データを生成する編集手段と、前記ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データを生成する全文字データ生成手段と、前記全文字データとして抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な第1群フォントに含まれている文字と、拡張文字である第2群フォントに含まれている文字と、外字である第3群フォントに含まれている文字と、に分別する文字分別手段と、前記第2群フォントに含まれている文字と前記第3群フォントに含まれている文字に対してはフォントの埋め込みを行う文字として設定する埋込文字設定手段と、前記埋込文字設定手段における設定にしたがって前記ユニコード編集済データを所定文書形式に変換し文書ファイルを得る文書形式変換手段と、を有するようにしたものである。
本発明によれば、メインフレーム(汎用コンピュータ)、等において使用される文字コードの体系で記述された原稿データを編集し、パーソナルコンピュータにおいて閲覧可能な文書ファイルを作成する際に、その文書ファイルのファイルサイズを削減することが可能な文書ファイル作成方法およびシステムが提供される。
本発明の文書ファイル作成方法およびシステムにおける文字の分別と処理についての概要を示す説明図である。 本発明の文書ファイル作成方法およびシステムにおける処理の過程の概要を示す説明図である。 本発明の文書ファイル作成方法およびシステムにおける構成の一例を示すブロック図である。 本発明の文書ファイル作成方法およびシステムにおける処理の過程の一例を示すフロー図である。 ホストコードと、そのコードに対応する字形の一例を示す図である。
次に、本発明の実施の形態について図を参照しながら説明する。本発明の文書ファイル作成方法およびシステムにおける文字の分別と処理についての概要を説明図として図1に示す。図1(A)は、メインフレーム(汎用コンピュータ)で使用されるホストコードで特定される文字に関して、パーソナルコンピュータ(PC)にフォントの字形が存在する文字と、フォントの字形が存在しない文字とに分別することの説明図である。また、図1(B)は、ホストコードをユニコード(UNICODE)に変換すること、パーソナルコンピュータ(PC)にフォントの字形が存在しない文字に関して、ユニコードのフォントの字形を作成することを示した説明図である。ここで、字形(グリフイメージ)とは、文字の形状そのものである。
図1(A)に示すように、たとえば、ホストコードで「A3B1」の字体は「1」、「A3C1」の字体は「A」、「A4A2」の字体は「あ」、「A5A2」の字体は「ア」、「B0A1」の字体は「亜」である。これらのホストコードで特定される字体は、SJIS(Shift JIS)コードにおいてはコードが相違するものの、存在する字体である。SJISコードに存在するのであるから、当然、ユニコードにおいてもコードが相違するものの、存在する字体である。ここで、字体(グリフ)とは、文字の形状についての抽象的概念である。
なお、一般的な(たとえば、日本語のOS(Operating System)を有する)パーソナルコンピュータ(PC)においては、文字のフォントが、一般的な書体である明朝体、ゴシック体、等であれば、そのフォントデータ(書体デザインの同じ字形の一揃いのデータ)を必ず有している。すなわち、ホストコードの文字のフォントが、一般的な明朝体、ゴシック体、等であれば、そのフォントの字形も、存在する字形である。したがって、上記の一例で示したような、メインフレームに存在する字形は、一般的なフォントである限り、パーソナルコンピュータにおいても存在する字形である。
一方、ホストコードで「41A1」の字体は「鳬」である。このホストコードで特定される文字は、SJISコードにおいては存在しない字体である。また、ホストコードで「41A1」の字体は「監」である。このホストコードで特定される文字は、SJISコードにおいては存在しない字体である。
なお、「鳬」と「監」は、ここでの文字表現を可能とするために置き換えた文字(類似字形の文字)である。ホストコードで「41A1」とホストコードで「41A1」の文字について、実際の字形の一例を図5に示す。
このように、SJISコードにおいては存在しない字体については、一般的なパーソナルコンピュータにおいては、そのフォントデータを有していない。したっがって、上記の一例で示したような、メインフレームに存在する字形は、パーソナルコンピュータにおいては存在しない字形である。
メインフレームに存在し、パーソナルコンピュータにおいては存在しない字体については、ユニコードに登録をしておく。ユニコードにおいてE000〜F8FFのコードは私用領域(Private Use Area)のコードである。図1(A)に示すように、ユニコードで「E400」の字体は「鳬」であり、その字体は私用領域に存在している。また、ユニコードで「F300」の字体は「監」であり、その字体は私用領域に存在している。この私用領域に存在する字体としては、ホストコードの体系における拡張文字と、ホストコードの体系には存在せず利用者が追加する字体すなわち外字が含まれている。
その結果、ホストコードに存在する字体のすべてをユニコードに存在する字体とすることができる。したがって、図1(B)の(1)に示すように、ホストコードをユニコードに変換するコード変換テーブルを作成することができる。
さらに、図1(B)の(2)、(3)に示すように、その字体のフォントデータを作成することにより、ホストコードに存在する字体のすべてをユニコードに存在する字形とすることができる。
なお、メインフレームに存在し、パーソナルコンピュータにおいては存在しない字体の内で、外字は、ユニコードの私用領域における外字領域として区別した領域のコードを割り当ててフォントを登録しておく。このように登録を行うことにより、外字の登録情況についての全体像の把握、外字の追加、変更、等を容易に行うことができる。
以上を総括すると、ホストコードにおいて存在する文字は、一般的なパーソナルコンピュータにおいては、字体と字形において存在する文字と存在しない文字に分類することができる。一般的なパーソナルコンピュータにおいて存在する文字は、当然、ユニコードにおいても存在する文字である。ここでは、この文字を第1群の文字と呼び、そのフォントデータを第1群のフォントデータ(または第1群フォント)と呼ぶ。また、一般的なパーソナルコンピュータにおいて存在しない文字は、拡張コードの文字または外字コードの文字である。拡張コードの文字を第2群の文字と呼び、そのフォントデータを第2群のフォントデータ(または第2群フォント)と呼び、外字コードの文字を第3群の文字と呼び、そのフォントデータを第3群のフォントデータ(または第3群フォント)と呼ぶ。
本発明の文書ファイル作成方法およびシステムにおける処理の過程を説明図として図2に示す。図2(A)は原稿データ(元データ)の入力から文書ファイルの作成までの処理過程を示し、図2(B)は第1群フォント〜第3群フォントに属する個々の文字に対する文書ファイルへの処理(埋込設定をするか否かの処理)を示す。
図2(A)に示すように、まず、「テキスト入力」において、文書ファイル作成システムは、作成する文書ファイルの原稿データであるテキスト形式のデータ(テキスト)すなわちホストコードデータを入力する。
次に、「コード変換テーブル」において、文書ファイル作成システムは、同一文字(字体)に対するホストコードとユニコードを対比させ、ホストコードとユニコードの対応関係を記述するコード変換テーブルを参照し、ホストコードデータをユニコードで記述されているデータすなわちユニコードデータに変換する。
ユニコードデータはテキスト形式のデータのままである。ここで、テキスト形式のデータとは、字体のコードを羅列したデータであって、文字の書体(フォント)、色、寸法、配置、等の指定はされていない。一般的に文書においては、文字の書体、色、寸法、等を指定し、さらにその指定した文字をページの所望の位置に配置し、必要ならば、他のオブジェクト(ロゴ、イラスト、イメージ)もページの所望の位置に配置する、等によってその文書が作成されるものである。すなわち、ユニコードデータを含むオブジェクトを編集(レイアウト)することによって文書が作成される。図2においては、その編集の工程は示されていないが、実際にはそのような工程がフォント埋込工程の前に存在する。その工程の内容(編集内容)は、本発明とは直接関係ないが、フォントの埋め込みを行うときには、すくなくとも、ユニコードデータにおいて使用されている文字に適用するフォントが指定されている必要性がある。ユニコードデータに対してすくなくともフォントを指定したデータをユニコード編集済データとする。ここで、書体(フォント)とは、似た特徴を有する字形(グリフイメージ)の集合のことである。また、フォントの埋め込みとは、そのフォントの特徴を有する文字の字形(グリフイメージ)を、それを特定するID(グリフID)と紐付けし、その紐付けしたデータ(字形とIDの組合わせ)を文書ファイルが有するようにし、文書ファイルの印刷、表示においてそのデータを利用できるようにすることである。
次に、「フォント埋込設定工程」において、文書ファイル作成システムは、ユニコード編集済データにおいて使用されている文字の内で、フォントの埋め込みを必要とする文字に対して、文書ファイルへ埋め込むための設定(埋込設定)を行う。
文書ファイル作成システムは、ユニコード編集済データにおいて使用されている文字について、前述した第1群フォント(一般的なパーソナルコンピュータにおいて存在する文字)、第2群フォント(拡張コードの文字)、第3群フォント(外字コードの文字)のいずれに属しているかを区別する。ユニコード編集済データの文字のコードは重複しないように抽出する。また、一つの文書において、複数の書体を使い分けて用いることは普通に行われているから、ユニコード編集済データの文字のコードが同一であってもフォント(書体)が相違するときには、フォントを区別する。たとえば、コードが同一であっても明朝体であれば、明朝体第1群フォント、明朝体第2群フォント、明朝体第3群フォントのいずれに属しているかを区別し、コードが同一であってもゴシック体であれば、ゴシック体第1群フォント、ゴシック体第2群フォント、ゴシック体第3群フォントのいずれに属しているかを区別する。このように、ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出する。その抽出したデータのこと全文字データと呼ぶ。文書ファイル作成システムは、その全文字データに含まれている文字について、いずれの群に属しているかを区別する。
そして、文書ファイル作成システムは、第2群フォントと第3群フォントに区分された文字(字形)に対しては、明朝体であれば明朝体の字形(グリフイメージ)を、ゴシック体であればゴシック体の字形(グリフイメージ)を文書ファイルへ埋め込むための設定(埋込設定)を行う。
次に、「PDF生成」において、文書ファイル作成システムは、前述した埋込設定にしたがったフォントの埋め込みを行って、ユニコード編集済データから文書ファイルを、ここでは一例としてPDFファイルとして生成する。
図2(B)に示すように、文書ファイル作成システムは、ホストコードデータとして「1あ鳬監」を入力する。ホストコードデータはテキスト形式のデータであるからホストコードの羅列である。したがって、実際のホストコードデータは「A3B1 A4A2 41A1 80A1」となっている。文書ファイル作成システムは、コード変換テーブルを参照し、文字「1」のホストコード「A3B1」をユニコード「FF11」に、文字「あ」のホストコード「A4A2」をユニコード「3042」に、文字「鳬」のホストコード「41A1」をユニコード「E400」に、文字「監」のホストコード「80A1」をユニコード「F300」に変換する。すなわち、ホストコードデータは変換されてユニコードデータ「FF11 3042 E400 F300」となる。
文書ファイル作成システムは、ユニコードデータ「FF11 3042 E400 F300」に対して、たとえば、フォントとしてゴシック体を指定し、ユニコード編集済データを生成する。さらに、そのユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出する。抽出したデータを全文字データと呼ぶことにすると、全文字データはコードがユニコードが「FF11 3042 E400 F300」の文字によって構成される。
文書ファイル作成システムは、全文字データのユニコード「FF11」について第3群フォントにそのコードのフォントは存在しないと判定する(第1処理)。続いて、第2群フォントにそのコードのフォントは存在しないと判定する(第2処理)。続いて、第1群フォントにそのコードのフォントは存在すると判定し、そこで、文書ファイル作成システムは、ユニコード「FF11」について埋込の設定を行わない(第3処理)。
また、文書ファイル作成システムは、全文字データのユニコード「3042」について第3群フォントにそのコードのフォントは存在しないと判定する(第1処理)。続いて、第2群フォントにそのコードのフォントは存在しないと判定する(第2処理)。続いて、第1群フォントにそのコードのフォントは存在すると判定し、そこで、文書ファイル作成システムは、ユニコード「3042」について埋込の設定を行わない(第3処理)。
また、文書ファイル作成システムは、全文字データのユニコード「E400」について第3群フォントにそのコードのフォントは存在しないと判定する(第1処理)。続いて、第2群フォントにそのコードのフォントは存在すると判定し、そこで、文書ファイル作成システムは、ユニコード「E400」について埋込の設定を行う(第2処理)。そして、埋込の設定が済んでいるから、文書ファイル作成システムは第3処理を行わない。
また、文書ファイル作成システムは、全文字データのユニコード「F300」について第3群フォントにそのコードのフォントは存在すると判定し、そこで、文書ファイル作成システムは、ユニコード「F300」について埋込の設定を行う(第1処理)。そして、埋込の設定が済んでいるから、文書ファイル作成システムは第2処理と第3処理を行わない。
図2(B)に示す処理の過程すなわち、第1処理、第2処理、第3処理の過程は、全文字データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出し、第1群フォント、第2群フォント、第3群フォントの内のいずれの群に属しているかを区別し、埋込処理を行う過程を実施する形態の一例である。
以上、構成と動作について基本的な内容の説明を行った。以下、本発明の文書ファイル作成方法およびシステムにおける構成と動作について具体的で詳細な内容の説明を行う。文書作成システムはコンピュータシステムのハードウェアとソフトウェアとによって実現することができる。本発明の文書ファイル作成システムにおける構成の一例ブロック図として図3に示す。図3において、文書作成システムは記憶部100と処理部200を有する。記憶部100において、101はコード変換テーブル、102は特定コードデータ、103はユニコードデータ、104ユニコード編集済データ、105は全文字データ、106は埋込文字設定データ、107は置換文字設定データ、108は第1群フォント、109は第2群フォント、110は第3群フォント、111は第4群フォント、112は文書ファイルである。また、処理部200において、201はユニコード変換手段、202は編集手段、203は全文字データ生成手段、204は文字分別手段、205は埋込文字設定手段、206は置換文字設定手段、207は文書形式変換手段である。
コード変換テーブル101は特定コードとユニコードとの対応関係を記述するテーブルである。特定コードとは、ユニコード以外のコード体系のコードであって、メインフレーム(汎用コンピュータ)、等の特定のコンピュータシステムで使用される漢字コードのことである。たとえば、富士通株式会社のJEF漢字コード、IBM(International Business Machines Corporation)のIBM漢字コード、日本電気株式会社(NEC)のJIPS漢字コード、株式会社日立製作所のKEIS漢字コード、等である。ユニコード(UNICODE)は各国で使われる文字(字体)を一貫した方法で符号化し、表現し、コンピュータで共通利用できるようにしたコンピュータ業界における世界標準のコード体系である。対応関係の記述とは、特定コードの字体とユニコードの字体が一致するときの特定コードとユニコードの組み合わせの記述のことである。したがって、特定コードまたはユニコードに対して字体が一致するユニコードまたは特定コードをコード変換テーブル101を参照することにより得ることができる。
特定コードデータ102は特定コードで記述されたテキストデータである。本発明の文書ファイル作成システムにおいては、処理の元となるデータすなわち原稿データである。テキストデータは、すでに説明したように、テキスト形式のデータすなわち文字(字体)のコードを羅列したデータである。
ユニコードデータ103はユニコードで記述されたテキストデータである。
ユニコード変換手段201は、特定コードデータ102を記述する一連の特定コードの各々に対して、コード変換テーブル101を参照して、対応関係を有する、すなわち文字(字体)が一致するユニコードを得て、その特定コードをそのユニコードに置き換えることによりユニコードデータ103を生成する。
編集手段202はユニコードデータ103に対してすくなくともフォントを指定する編集を行いユニコード編集済データ104を生成する。すでに説明したように、ユニコードデータ103を含むオブジェクトを編集(レイアウト)することによって文書が作成される。編集手段202は、そのような一般的な編集を行うことができるアプリケーションソフトウェアによって実現することができる。実際、一般的な編集システムにおける編集の過程の内において本発明の文書ファイル作成方法を適用する構成とすることができる。また、本発明において、編集手段202はフォントの指定に限定したものであってもよい。フォントの指定に限定し、別工程において、その他の編集を行うように構成することもできる。
全文字データ生成手段203は、ユニコード編集済データ104において使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データ105を生成する。ユニコード編集済データ104において使用されているフォントが、たとえば明朝体とゴシック体の2つであるとする。そのときに、この重複しないように抽出する方法として、全文字データ生成手段203は、ユニコード編集済データ104において使用されている明朝体の文字のコードが重複しないように抽出して明朝体の全文字データを生成する。さらに、全文字データ生成手段203は、ユニコード編集済データ104において使用されているゴシック体の文字のコードが重複しないように抽出してゴシック体の全文字データを生成する。したがって、全文字データ105は、このように複数のフォントが使用されるときには、それらのフォントに対応する全文字データの集合となる。
全文字データ生成手段203が全文字データ105を生成するときの、ユニコード編集済データ104の範囲は、一つの文書ファイルに変換するデータの範囲である。たとえば、文書ファイルが、顧客宛のダイレクトメールに同封して送付するクレジットカードの明細書のような帳票であるとする。そのときには、ユニコード編集済データ104の範囲は、顧客単位のデータ、すなわち、その顧客宛の帳票に変換するデータの範囲である。ユニコード編集済データ104が複数の顧客宛の帳票に対するデータを含んでいるときには、全文字データ生成手段203は、個々の顧客宛の帳票に対するデータの範囲に対して全文字データ105を生成する。したがって、ユニコード編集済データ104は、このように複数の文書ファイルに対するデータが含まれているときには、個々の文書ファイルに対応するユニコード編集済データの集合となる。
全文字データ生成手段203が全文字データ105を生成するときの、上記のデータの範囲を区別する方法としては、たとえば、編集手段202において、そのデータの範囲の区切り記号(データの範囲を特定する記号)を、ユニコード編集済データ104に対して挿入しておく、等の方法を適用することができる。
文字分別手段204は全文字データ105として抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な第1群フォント108に含まれている文字と、拡張文字である第2群フォント109に含まれている文字と、外字である第3群フォント110に含まれている文字とに分別する。さらに、第1群フォント108、第2群フォント109、第3群フォント110のいずれにもに含まれない文字が存在するときには、その文字を第4群フォント111に含まれている文字に分別する。
第1群フォント108に含まれている文字とは、SJISコードに割り当てられているユニコードの領域の文字(字体)であって、その文字に指定されたフォントの文字(字形)がパーソナルコンピュータに実装されている文字のことである。したがって、第1群フォント108は、そのフォントの文字(字形)が実装されている文字のユニコードを集合したデータとすることができる。
あるいは、第1群フォント108は、SJISコードに割り当てられているユニコードにおける各々のユニコードに対応付けてフォントの文字(字形)を登録したフォントデータとすることができる。後者の場合は、フォントの文字(字形)が登録されていないユニコードが存在してもよく、その登録がされていないユニコードの文字は第1群フォント108に含まれていない文字であり、その登録がされているユニコードの文字は第1群フォント108に含まれている文字である。
第1群フォント108は、明朝体の第1群フォント108、ゴシック体の第1群フォント108、のようにフォントの各々に対応して存在する。第2群フォント109、第3群フォントにおいても同様である。
第2群フォント109に含まれている文字とは、特定コードの拡張文字に割り当てられているユニコードの領域の文字である。また、第3群フォント110に含まれている文字とは、特定コードの外字に割り当てられているユニコードの領域の文字である。第2群フォント109と第3群フォント110に含まれている文字のユニコードは、ユニコードにおける私用領域(Private Use Area)のコード、すなわちE000〜F8FFのコードとすることが、他コードの利用上の干渉を起こすことがすくなく好適である。
第1群フォント108の場合と同様に、第2群フォント109と第3群フォント110は、そのフォントの文字(字形)が実装されている文字のユニコードを第2群フォント109と第3群フォント110の各々において集合した各々のデータとすることができる。
あるいは、私用領域を第2群フォント109と第3群フォント110の各々に分割し、ユニコードに対応付けてそのフォントの文字(字形)を登録した、第2群フォント109と第3群フォント110の各々のフォントデータとすることができる。後者の場合は、フォントの文字(字形)が登録されていないユニコードが存在してもよく、その登録がされていないユニコードの文字は含まれていない文字であり、その登録がされているユニコードの文字は含まれている文字である。
第4群フォント111に含まれている文字とは、第1群フォント108、第2群フォント109、第3群フォント110のいずれにもに含まれない文字である。したがって、第4群フォント111は、その文字のユニコードを集合したデータとすることができる。
埋込文字設定手段205は、第2群フォントに含まれている文字と第3群フォントに含まれている文字に対してはフォントの埋め込みを行う文字として設定する。フォントの埋め込みは文書ファイル112に対して行う。すなわち、文書ファイル112には第2群フォントに含まれている文字と第3群フォントに含まれている文字が埋め込まれる。
置換文字設定手段206は第4群フォントに含まれている文字に対しては所定コードの文字に置換する設定を行う。文字(字体)の置換は文書ファイル112に対して行う。すなわち、文書ファイル112においては第4群フォントに含まれている文字が所定コードの文字に置換される。
たとえば、置換文字設定手段206は、所定の文字を空白(スペース)とし、第4群フォントに含まれている文字のすべてを空白に置換する。そのような限定された内容の置換については、自動設定により行うことができる。また、置換文字設定手段206は、オペレータによる手動設定により、第4群フォントに含まれている文字によって所定コードの文字を選択的に設定することができる。
文書形式変換手段207は、埋込文字設定手段205と置換文字設定手段206における設定にしたがってユニコード編集済データ104を所定文書形式に変換し文書ファイル112を得る。文書ファイル112における第1群フォント108の文字は、この変換によって、パーソナルコンピュータによって処理可能なコード、たとえばSJISコードに変換されている。また、この変換によって、文書ファイル112における第2群フォント109の文字と第3群フォント110の文字については、その字形(グリフイメージ)と、それを特定するID(グリフID)のデータとして、文書ファイル112が有している。また、この変換によって、文書ファイル112における第4群フォント111の文字については、置換文字設定手段206によって、パーソナルコンピュータによって処理可能な所定のコードが与えられている。
文書ファイル112の文書形式としては、本発明において制限はないが、たとえば、アドビ・システムズ社のPDF(Portable Document Format)、国際電子出版フォーラム(International Digital Publishing Forum,IDPF)の電子書籍用ファイル・フォーマット規格であるEPUB(Electronic PUBlication)、HTML(HyperText Markup Language)、等のフォントの埋め込みが可能な文書形式である。
以上、構成について説明した。次に、本発明の文書ファイル作成方法およびシステムにおける動作について具体的な内容の説明を行う。本発明の文書ファイル作成方法およびシステムにおける処理の過程の一例をフロー図として図4に示す。
まず、図4のステップS101(JEFデータ入稿)において、富士通株式会社のメインフレームで使用されているJEF漢字コードのテキストデータとして原稿データが入稿する。文書ファイル作成システムはこの原稿データを読み込み、特定コードデータ102として記憶部100に記憶する。
次に、ステップS102(テーブル変換)において、JEF漢字コードとユニコードとの対応関係を記述したコード変換テーブルは前もって作成済みであり、文書ファイル作成システムはそのコード変換テーブルを読み込み、コード変換テーブル101として記憶部100に記憶する。
次に、ステップS103(UNICODEデータ生成)において、ユニコード変換手段201は、コード変換テーブル101を参照して、特定コードデータ102におけるJEF漢字コードをユニコードに変換し、ユニコードデータ103を生成する。
次に、ステップS104(帳票レイアウト作成)において、編集手段202は、オペレータの指示入力にしたがって、ユニコードデータ103に対して文字の書体、色、寸法(ポイント)、色、ページにおける配置、等の編集(レイアウト)を行う。また、必要ならば、テキストデータ以外の他のオブジェクト(ロゴ、イラスト、イメージ)についても編集を行う。そして、編集手段202はユニコード編集済データ104を生成する。
次に、ステップS105(抽出する全ページの全文字コード集約)において、全文字データ生成手段203は、ユニコード編集済データ104において使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データ105を生成する。全文字データ生成手段203が全文字データ105を生成するときの、ユニコード編集済データ104の範囲は、一つの文書ファイルに変換するデータの範囲(抽出する全ページ)である。
次に、ステップS106(第3群フォント内に文字があるか)において、文字分別手段204は、全文字データ105の文字の内で、外字である第3群フォント110に含まれている文字を分別する。
次に、ステップS107(埋込データA生成)において、埋込文字設定手段205は、ステップS106において分別された文字の全体として、文書ファイルを作成するときにフォントの埋め込みを行う文字のデータすなわち字形(グリフイメージ)のデータである埋込データAを生成する。この一例においては、この生成によりフォントの埋め込みの設定が行われる。
次に、ステップS108(第2群フォント内に文字があるか)において、文字分別手段204は、全文字データ105の文字の内で、拡張文字である第2群フォント109に含まれている文字を分別する。
次に、ステップS109(埋込データA+B生成)において、埋込文字設定手段205は、ステップS106とステップS108において分別された文字の全体として、文書ファイルを作成するときにフォントの埋め込みを行う文字のデータすなわち字形(グリフイメージ)のデータである埋込データA+Bを生成する。この一例においては、この生成により字形(グリフイメージ)の埋め込みの設定が行われる。
次に、ステップS110(第1群フォント内に文字があるか)において、文字分別手段204は、全文字データ105の文字の内で、SJISコードに割り当てられているユニコードの領域の文字である第1群フォント108に含まれている文字を分別する。このステップにおいて分別された文字の全体は埋め込みを行わない文字である。
次に、ステップS111(存在しない文字はスペースに変換)において、文字分別手段204は、全文字データ105の文字の内で、第1群フォント108、第2群フォント109、第3群フォント110のいずれにも含まれていない文字のすべてを第4群フォント111の文字とする。そして、置換文字設定手段は206は、オペレータの指示入力にしたがって、その第4群フォント111の文字を所定の文字に置換する設定を行う。この一例においてはスペースに置換(変換)する設定を行う。
次に、ステップS112(抽出したページのPDF作成)において、文書形式変換手段207は、埋込文字設定手段205と置換文字設定手段206における設定にしたがってユニコード編集済データ104を所定文書形式に変換し文書ファイル112を得る。この一例においてはPDFファイルを得る。
なお、ここで得られた文書ファイル112は、(顧客一人分の)一つの文書ファイルである。ステップS101において、入稿した原稿データすなわち特定コードデータ102が(顧客複数分の)複数の文書ファイルのデータであるときには、ステップS105に戻って前述した以降のステップを繰り返す。そして、特定コードデータ102から作成するすべての文書ファイルの作成が完了したところで、終了とする。
文字コードの体系が相違するコンピュータシステムにおいて閲覧可能な文書ファイルを作成する際に、その文書ファイルのファイルサイズを削減する、等において利用可能である。
100 記憶部
101 コード変換テーブル
102 特定コードデータ
103 ユニコードデータ
104 ユニコード編集済データ
105 全文字データ
106 埋込文字設定データ
107 置換文字設定データ
108 第1群フォント
109 第2群フォント
110 第3群フォント
111 第4群フォント
112 文書ファイル
200 処理部
201 ユニコード変換手段
202 編集手段
203 全文字データ生成手段
204 文字分別手段
205 埋込文字設定手段
206 置換文字設定手段
207 文書形式変換手段

Claims (8)

  1. 特定コードとユニコードとの対応関係を記述するコード変換テーブルを使用して、特定コードで記述されたテキストデータである特定コードデータから、ユニコードで記述されたテキストデータであるユニコードデータを生成するユニコード変換過程と、
    前記ユニコードデータに対してすくなくともフォントを指定する編集を行いユニコード編集済データを生成する編集過程と、
    前記ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データを生成する全文字データ生成過程と、
    前記全文字データとして抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な第1群フォントに含まれている文字と、拡張文字である第2群フォントに含まれている文字と、外字である第3群フォントに含まれている文字と、に分別する文字分別過程と、
    前記第2群フォントに含まれている文字と前記第3群フォントに含まれている文字に対してはフォントの埋め込みを行う文字として設定する埋込文字設定過程と、
    前記埋込文字設定過程における設定にしたがって前記ユニコード編集済データを所定文書形式に変換し文書ファイルを得る文書形式変換過程と、
    を有することを特徴とする文書ファイル作成方法。
  2. 請求項1に記載の文書ファイル作成方法において、前記文字分別過程は、前記第1群フォント、第2群フォント、第3群フォントのいずれにもに含まれない文字を第4群フォントに含まれている文字とする過程であって、前記第4群フォントに含まれている文字に対しては所定コードの文字に置換する設定を行う置換文字設定過程を有し、前記文書形式変換過程は、前記埋込文字設定過程と前記置換文字設定過程における設定にしたがって前記ユニコード編集済データを所定文書形式に変換し文書ファイルを得ることを特徴とする文書ファイル作成方法。
  3. 請求項1または2に記載の文書ファイル作成方法において、前記特定コードはメインフレーム(汎用コンピュータ)において使用されている文字コードの体系のコード(ホストコード)であることを特徴とする文書ファイル作成方法。
  4. 請求項1〜3のいずれかに記載の文書ファイル作成方法において、前記所定文書形式はPDFであり、前記文書ファイルはPDFファイルであることを特徴とする文書ファイル作成方法。
  5. 請求項2に記載の文書ファイル作成方法において、前記所定コードは「スペース」のコードであることを特徴とする文書ファイル作成方法。
  6. 請求項1〜5のいずれかに記載の文書ファイル作成方法において、前記第1群フォントはSJIS(Shift JIS)コードのフォントであることを特徴とする文書ファイル作成方法。
  7. 請求項1〜6のいずれかに記載の文書ファイル作成方法において、前記第2群フォントと前記第3群フォントのコードはユニコードにおける私用領域(Private Use Area)であるE000〜F8FFのコードであることを特徴とする文書ファイル作成方法。
  8. 特定コードとユニコードとの対応関係を記述するコード変換テーブルを使用して、特定コードで記述されたテキストデータである特定コードデータから、ユニコードで記述されたテキストデータであるユニコードデータを生成するユニコード変換手段と、
    前記ユニコードデータに対してすくなくともフォントを指定する編集を行いユニコード編集済データを生成する編集手段と、
    前記ユニコード編集済データにおいて使用されている文字のコードとフォントの組合せをその組合せが重複しないように抽出して全文字データを生成する全文字データ生成手段と、
    前記全文字データとして抽出された文字を、パーソナルコンピュータが保有するフォントデータによって処理可能な第1群フォントに含まれている文字と、拡張文字である第2群フォントに含まれている文字と、外字である第3群フォントに含まれている文字と、に分別する文字分別手段と、
    前記第2群フォントに含まれている文字と前記第3群フォントに含まれている文字に対してはフォントの埋め込みを行う文字として設定する埋込文字設定手段と、
    前記埋込文字設定手段における設定にしたがって前記ユニコード編集済データを所定文書形式に変換し文書ファイルを得る文書形式変換手段と、
    を有することを特徴とする文書ファイル作成システム。
JP2012151062A 2012-07-05 2012-07-05 文書ファイル作成方法およびシステム Pending JP2014013523A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012151062A JP2014013523A (ja) 2012-07-05 2012-07-05 文書ファイル作成方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012151062A JP2014013523A (ja) 2012-07-05 2012-07-05 文書ファイル作成方法およびシステム

Publications (1)

Publication Number Publication Date
JP2014013523A true JP2014013523A (ja) 2014-01-23

Family

ID=50109160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012151062A Pending JP2014013523A (ja) 2012-07-05 2012-07-05 文書ファイル作成方法およびシステム

Country Status (1)

Country Link
JP (1) JP2014013523A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式
JP2002318797A (ja) * 2001-04-23 2002-10-31 Toppan Forms Co Ltd ドキュメント作成システムおよびドキュメント作成方法並びにこれらで作成されたドキュメントファイルを用いたドキュメント閲覧システム
JP2005215915A (ja) * 2004-01-29 2005-08-11 Dainippon Printing Co Ltd 個人情報配信システム
JP2006107226A (ja) * 2004-10-07 2006-04-20 Dainippon Printing Co Ltd 文字コード変換方法及び文字コード変換プログラム
JP2009545064A (ja) * 2006-07-25 2009-12-17 モノタイプ.イメージング.インコーポレイテッド フォントサブセッティングのための方法と装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式
JP2002318797A (ja) * 2001-04-23 2002-10-31 Toppan Forms Co Ltd ドキュメント作成システムおよびドキュメント作成方法並びにこれらで作成されたドキュメントファイルを用いたドキュメント閲覧システム
JP2005215915A (ja) * 2004-01-29 2005-08-11 Dainippon Printing Co Ltd 個人情報配信システム
JP2006107226A (ja) * 2004-10-07 2006-04-20 Dainippon Printing Co Ltd 文字コード変換方法及び文字コード変換プログラム
JP2009545064A (ja) * 2006-07-25 2009-12-17 モノタイプ.イメージング.インコーポレイテッド フォントサブセッティングのための方法と装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JPN6016026030; 礒山 和久: '漢字が足りない?Windowsにおける漢字処理' Back Office MAGAZINE 第3巻第6号, 19990601, p.156-160, CQ出版株式会社 *
JPN6017003514; 山田 晃輔: 'パート3 Webfontsについて' Web Designing 第10巻第8号, 20100801, p.84-88, (株)毎日コミュニケーションズ *
JPN6017003515; 'ダイナフォントdeホームページ+外字ベーシック書体編' Professional DTP 2004 5月号 初版 , 20040501, p.31, 株式会社工学社 *
JPN6017003516; 'モリサワ・ドキュメント・ソリューション=MDS' 印刷情報 第62巻第11号, 20021101, p.52-56, (株)印刷出版研究所 *

Similar Documents

Publication Publication Date Title
US7313754B2 (en) Method and expert system for deducing document structure in document conversion
EP1538534A2 (en) Generation of a PPML template from a PDF document
CN100405282C (zh) 文档处理装置和文档处理方法
JP5623079B2 (ja) ハード・コピーの書式からの書式定義の自動発生
US7651286B2 (en) Method arrangement and computer software for the printing of a separator sheet by means of an electrophotographic printer or copier
US20050235202A1 (en) Automatic graphical layout printing system utilizing parsing and merging of data
US7710590B2 (en) Automatic maintenance of page attribute information in a workflow system
US20020095443A1 (en) Method for automated generation of interactive enhanced electronic newspaper
JPH0991301A (ja) 文書情報管理システムおよび文書情報管理方法
EP3633597A1 (en) Apparatus and method for tracing a document in a publication
CA2396881A1 (en) Imaging documents having static content and variable data
CN108804053A (zh) 信息处理装置和存储介质
US8908209B2 (en) Altering a PDF print job based upon criteria stored in memory of a printing system
US8136120B2 (en) Methods and systems of reconciling sources of print job processing information in a print processing environment
US20210125386A1 (en) Systems and methods for clipping images
US10089049B2 (en) Ganged imposition postal sort system
CN102169478A (zh) 用于呈现多语言文本的装置和方法
JP2014013523A (ja) 文書ファイル作成方法およびシステム
JP5228569B2 (ja) ウェブを利用したバリアブルプリント方法、ウェブを利用したバリアブルプリントシステムおよび入稿データ加工装置
JP2011248421A (ja) データ作成方法及びデータ作成システム
US20160371233A1 (en) Assistive technology for the impaired
EP2711847A2 (en) Page data generation apparatus, recording medium and page data generation method
JP5423197B2 (ja) バリアブル印刷システム,バリアブル印刷方法,レイアウト変換装置及びテキスト画像生成装置
JPS61195455A (ja) 文書作成装置
JP2005044176A (ja) バリアブルフォームデータ生成検証システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160831

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170207