JP4766030B2

JP4766030B2 - 画像処理装置及び画像処理プログラム

Info

Publication number: JP4766030B2
Application number: JP2007265652A
Authority: JP
Inventors: 俊一木村; 一憲宋; 雅則関野; 裕越
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2007-10-11
Filing date: 2007-10-11
Publication date: 2011-09-07
Anticipated expiration: 2027-10-11
Also published as: JP2009094955A; US8483499B2; US20090097765A1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。

画像データ全体又はその画像内の個々の文字画像を、ベクトル情報（アウトライン情報を含む）に変換し、画像の再利用を容易にしようとする技術が存在する。例えば、文字画像をアウトライン化することによって、画像を拡大したときであっても、画質劣化のない画像を得ることができるようになる。又は、アウトライン化によって、編集等の再利用が容易となる。

これに関連する技術として、例えば、特許文献１には、紙原稿中の文字をアウトライン化する際には、できるだけ高解像度で二値化した文字オブジェクト二値画像をアウトライン化した方が、高画質なアウトラインデータを生成できるが、一方で、高解像度二値画像をアウトライン化する際には、情報量が大きいためにアウトライン化処理に時間がかかるという問題点を鑑み、処理時間を短縮しつつ、高品位なアウトライン化画像を生成することを目的とし、小さな文字は高解像度二値画像よりアウトライン化し、大きな文字は低解像度二値画像よりアウトライン化することが開示されている。つまり、入力画像の文字認識を行い、かつ文字形状をアウトライン化することを行っている。

さらに、カラー画像を層に分けて、ファイル化する例を示す。
一般にカラー画像のデータ量は大きいため、圧縮して蓄積、あるいは、伝送が行われる。画像に歪みを与えない可逆圧縮方式では、高い圧縮率を得ることができないため、一般的な圧縮画像フォーマットとしては、ＪＰＥＧ方式（さらに具体的にはＪＰＥＧベースライン方式、以下、単純にＪＰＥＧ方式と称する）が利用されることが多い。ＪＰＥＧ方式は非可逆符号化の一種であるため、圧縮によって、画像に歪みが生じる。そのため、極端に高い圧縮率を得ることは困難である。

そこで、従来のＪＰＥＧ方式よりも高い圧縮率を得る方式として、特許文献２又は特許文献３に示されるような多層構造の画像フォーマットが提案されてきた。
これらは、ＪＰＥＧ方式による画像の歪みは、主として、高周波成分電力の大きな画像のエッジ部分に発生するという現象を避けるため、入力画像を、高周波成分電力の大きな文字／線画部分と、文字／線画部分を除いたバックグラウンド部分に分解して、バックグラウンド部分は、ＪＰＥＧ方式で高い圧縮率で圧縮し、文字／線画部分は、可逆符号化で圧縮するという方策を採るものである。

例えば、特許文献２には、デジタル画像データの圧縮率を高めることを課題とし、オリジナルピクセルマップを２つのプレーンにセグメント化し、次に各プレーンを効率的な方法で別々に圧縮し、損失性圧縮法で十分に圧縮するピクセルは一方のプレーンに配置され、非損失性圧縮が施されるべきピクセルはもう一方のプレーンに配置され、セレクタプレーンはオリジナルピクセルマップの全てのピクセルを追跡するために作成されることが開示されている。

また、例えば、特許文献３には、文書を、複数のバイナリ前景平面を有する複合ラスタコンテンツフォーマットで画像データに変換するシステム及び方法を提供することを課題とし、画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定し、１つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされ、これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算され、画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成されることが開示されている。
特開２００６−２５３８９２号公報特開２０００−１９６８９３号公報特開２００５−２２８３３１号公報

ところで、多値画像内の文字等と絵柄を分離して、それぞれに適した符号化を行うことによって、高い圧縮率を得ることができるが、文字等の再現性に関してはその符号化による品質に左右されることになる。
本発明は、多値画像内の２値画像をベクトル化した場合であっても、前記多値画像を用いて、多値画像を生成した場合の再現性の劣化を抑制するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項１記載の発明は、多値画像から前景の多値画像、背景の多値画像及び該前景の多値画像を切り抜くための選択情報である２値画像を抽出する画像抽出手段と、前記画像抽出手段によって抽出された２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記画像抽出手段によって抽出された前景の多値画像、前記画像抽出手段によって抽出された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成するファイル形成手段を具備し、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記ベクトル情報で切り抜かれる前記前景の多値画像は、アウトライン化された文字を含む領域内を該文字の色で塗り潰したものとすることを特徴とする画像処理装置である。

請求項２記載の発明は、前記画像処理装置は、前記画像抽出手段によって抽出された前景の多値画像を符号化する第１の符号化手段と、前記画像抽出手段によって抽出された背景の多値画像を符号化する第２の符号化手段を具備し、前記ファイル形成手段は、前記第１の符号化手段によって符号化された前景の多値画像、前記第２の符号化手段によって符号化された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成することを特徴とする請求項１に記載の画像処理装置である。

請求項３記載の発明は、多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記画像抽出手段によって抽出された２値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段を具備し、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記色決定手段は、文字内の前記２値画像の色が一つである場合、文字内の前記２値画像の色が複数であってその色が類似している場合、文字内の前記２値画像の色が複数であってその色が類似していない場合に分けて処理を行うことを特徴とする画像処理装置である。

請求項４記載の発明は、多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記多値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段を具備し、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記色決定手段は、前記多値画像内の文字内の平均色をベクトル情報の色情報とする、前記多値画像内の文字内の画素値が類似している場合と類似していない場合に分けてベクトル情報の色情報を決定する、又は前記多値画像内の文字の中心付近の色でベクトル情報の色情報を決定することを特徴とする画像処理装置である。

請求項５記載の発明は、前記色決定手段は、前記ベクトル情報に対応する２値画像が複数ある場合、該２値画像の色の平均値又は色の占める面積に基づいて、該ベクトル情報の色を決定することを特徴とする請求項３又は４に記載の画像処理装置である。

請求項６記載の発明は、コンピュータを、多値画像から前景の多値画像、背景の多値画像及び該前景の多値画像を切り抜くための選択情報である２値画像を抽出する画像抽出手段と、前記画像抽出手段によって抽出された２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記画像抽出手段によって抽出された前景の多値画像、前記画像抽出手段によって抽出された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成するファイル形成手段として機能させ、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記ベクトル情報で切り抜かれる前記前景の多値画像は、アウトライン化された文字を含む領域内を該文字の色で塗り潰したものとすることを特徴とする画像処理プログラムである。

請求項７記載の発明は、コンピュータを、多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記画像抽出手段によって抽出された２値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段として機能させ、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記色決定手段は、文字内の前記２値画像の色が一つである場合、文字内の前記２値画像の色が複数であってその色が類似している場合、文字内の前記２値画像の色が複数であってその色が類似していない場合に分けて処理を行うことを特徴とする画像処理プログラムである。

請求項８記載の発明は、コンピュータを、多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記多値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段として機能させ、前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、前記色決定手段は、前記多値画像内の文字内の平均色をベクトル情報の色情報とする、前記多値画像内の文字内の画素値が類似している場合と類似していない場合に分けてベクトル情報の色情報を決定する、又は前記多値画像内の文字の中心付近の色でベクトル情報の色情報を決定することを特徴とする画像処理プログラムである。

請求項１の画像処理装置によれば、多値画像内の２値画像をベクトル化した場合であっても、前記多値画像を用いて、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

請求項２の画像処理装置によれば、本構成を有していない場合に比較して、容量が増大することを抑制したファイル画像を生成することができるようになる。

請求項３の画像処理装置によれば、多値画像内の２値画像をベクトル化した場合であっても、色情報を付与して、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

請求項４の画像処理装置によれば、多値画像内の２値画像をベクトル化した場合であっても、色情報を付与して、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

請求項５の画像処理装置によれば、本構成を有していない場合に比較して、再現性の劣化を抑制した上で、より容量効率のよい色情報を付与することができるようになる。

請求項６の画像処理プログラムによれば、多値画像内の２値画像をベクトル化した場合であっても、前記多値画像を用いて、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

請求項７の画像処理プログラムによれば、多値画像内の２値画像をベクトル化した場合であっても、色情報を付与して、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

請求項８の画像処理プログラムによれば、多値画像内の２値画像をベクトル化した場合であっても、色情報を付与して、多値画像を生成した場合の再現性の劣化を抑制することができるようになる。

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
なお、本実施の形態で用いるモジュールとは、一般的に論理的に分離可能なソフトウエア（コンピュータ・プログラム）、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させること、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。なお、１つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（データの授受、指示、データ間の参照関係等）を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク（一対一対応の通信接続を含む）等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。

なお、画像データとは、画像を、数値を有した点（ドット）の羅列として表現したデータをいい、ビットマップ画像、ラスタ画像ともいわれる。圧縮又は暗号化等が行われた画像データでもよいが、ベクトル情報又はアウトライン情報は含まれない。画像データを格納するファイル形式として、ＢＭＰ（ＢｉｔＭａＰ）、ＴＩＦＦ（ＴａｇｇｅｄＩｍａｇｅＦｉｌｅＦｏｒｍａｔ）、ＰＮＧ（ＰｏｒｔａｂｌｅＮｅｔｗｏｒｋＧｒａｐｈｉｃｓ）、ＪＰＥＧ／ＪＰＥＧ２０００（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐ）、ＧＩＦ（ＧｒａｐｈｉｃｓＩｎｔｅｒｃｈａｎｇｅＦｏｒｍａｔ）などがある。また、本実施の形態で扱う画像データは、１枚の画像であってもよいし、複数枚の画像データであってもよい。なお、本実施の形態が入力対象とする画像データは、多値画像（カラー画像等を含む）データであり、１画素に３以上の状態（カラー、多値）がある画像データである。

また、画素の塊とは、４連結又は８連結で連続する画素領域（一つの連結成分）を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、４連結等で連続した画素領域が複数あり、その複数の画素領域が近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての１行から１文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は所定間隔で切り出した画像領域等がある。また、文字認識の際に、文字矩形を取得して、その文字矩形内の黒画素を文字として捉えてもよい。
なお、１つの画素の塊として、１文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。以下、「文字」又は「文字画像」という場合は、特に断りがない限り「画素の塊」の意で用いる。

また、ベクトル化には、アウトライン化を含む。アウトライン化とは、文字画像の輪郭形状をベジエのような曲線等で近似して表す方法である。このような手法の例として、特許文献１記載の技術を挙げることができる。また、ベクトル化とは、対象としては文字画像に限られず、前述の画素の塊を対象として、直線、円弧、ベジエ曲線、面、塗り潰し等の数式（アルゴリズム等を含む）等の描画情報によってその画像を表現するものである。以下、アウトライン化を主に例示して説明するが、その他のベクトル化であってもよい。また、ここでは、文字画像に文字コードを割り当てたファイルを生成することもベクトル化に含める。
また、ベクトル情報から画像データを生成すること（ベクトル化の逆）をレンダリング処理という。
また、ファイルとは、一つの単位として記憶又は処理される、名前の付いた情報の集合であり、ＯＳ（オペレーティングシステム）や応用ソフトウエアがプログラムやデータを扱う際のひとまとまりの単位となるものである。

＜第１の実施の形態＞
第１の実施の形態（第１−１の実施の形態〜第１−３の実施の形態を含む）の概要について説明する。
第１の実施の形態では、多値画像をＮ（１以上の整数）層に分離した２値画像に対し、アウトライン化処理を行う。なお、Ｎ層に分離する技術として特許文献３に示すような技術を用いてもよい。つまり、多値画像内の色とエッジの特徴に基づいて、Ｎ層に分離する。その場合に、類似の色値を有する画素群であって、その画素群を囲んでおり、連続した境界を有する領域を１つの２値画像とすればよい。

Ｎ個の２値画像それぞれに対してアウトライン化処理を行い、フォント登録を行って、Ｎ個の文字層と１個の多値画像層に変換する。ここで、フォント登録とは、フォントファイルを作成することである。
出力データフォーマットは、１個の多値画像層と、各々に色データを付与したＮ個の文字層データ（フォントファイルを含んでもよい）である。
フォントファイルとしては、Ｎ個の文字層それぞれに独立にフォントファイルを形成してもよいし、画像全体で一つのフォントファイルを形成してもよい。
フォアグラウンド画像とは、主に文字又は線画等からなる画像であり、２値画像となってもその画像の形状は基本的に異なるものにはならない画像をいう。以下に説明する実施の形態では、ベクトル化の対象となる画像である。
バックグラウンド画像とは、フォアグラウンド画像以外の画像をいい、主に写真又は画像の背景となる地肌等からなる画像であり、多値画像で表現すべき画像である。

＜第１−１の実施の形態＞
図１は、第１−１の実施の形態の構成例についての概念的なモジュール構成図を示している。
第１−１の実施の形態は、図１に示すように、Ｎ層分離モジュール１１０、文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎ、多値バックグラウンド層処理モジュール１２９、出力ファイル形成モジュール１３０を有している。

Ｎ層分離モジュール１１０は、文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎ、多値バックグラウンド層処理モジュール１２９、出力ファイル形成モジュール１３０と接続されており、入力した多値画像からベクトル化の対象となる画像を２値画像として抽出する。さらに、抽出した２値画像以外の画像をバックグラウンドの多値画像として抽出するようにしてもよい。つまり、入力画像は、Ｎ層分離モジュール１１０によって、色毎に分けられたＮ層の２値画像（１色に１層を割り当てる）と、１層のバックグラウンド多値画像に分けられる。なお、Ｎ層に分離する技術として特許文献３に示すような技術を用いてもよい。
また、Ｎ層分離モジュール１１０は、２値画像として複数を抽出し、その各々の２値画像の色情報を抽出し、その色情報を出力ファイル形成モジュール１３０に渡すようにしてもよい。色情報とは、抽出した２値画像の各々の２値画像の代表となる色を表すデータである。具体的には、ＲＧＢ等で表される色のデータ、色を識別できる識別子（「２」は「青」を表す等）等がある。

文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎは、Ｎ層分離モジュール１１０、出力ファイル形成モジュール１３０と接続されており、Ｎ層分離モジュール１１０によって抽出された２値画像をベクトル化してベクトル情報を生成し、そのベクトル情報を含む結果を文字層データとして出力ファイル形成モジュール１３０へ渡す。図１では、文字層処理モジュールは、各々の２値画像の層に対応してＮ個あるが、１つの文字層処理モジュールが全ての２値画像を処理するようにしてもよいし、Ｎ個よりも多い文字層処理モジュールが予め用意されていてもよい。第１−１の実施の形態以外においても同様である。
なお、文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎ内のモジュール構成、その処理等の詳細については、第１−１−１の実施の形態〜第１−１−４の実施の形態を用いて説明する。

多値バックグラウンド層処理モジュール１２９は、Ｎ層分離モジュール１１０、出力ファイル形成モジュール１３０と接続されており、ＪＰＥＧ化等の多値画像符号化処理を行う。つまり、Ｎ層分離モジュール１１０により分離されたバックグラウンド多値画像を受け取り、多値画像符号化処理を行い、その結果を出力ファイル形成モジュール１３０へ渡す。ただし、多値バックグラウンド層処理モジュール１２９は、多値画像符号化処理を行わず、Ｎ層分離モジュール１１０により分離されたバックグラウンド多値画像をそのまま出力ファイル形成モジュール１３０へ渡すようにしてもよい。

出力ファイル形成モジュール１３０は、Ｎ層分離モジュール１１０、文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎ、多値バックグラウンド層処理モジュール１２９と接続されており、Ｎ層分離モジュール１１０から各文字層の色情報を受け取り、文字層処理モジュール１２１、文字層処理モジュール１２２、文字層処理モジュール１２Ｎの各々から文字層データを受け取り、多値バックグラウンド層処理モジュール１２９から多値画像符号化処理の結果（多値画像符号化処理が行われていないバックグラウンド多値画像であってもよい）を受け取り、出力ファイル３００を形成する。その形成の際に、文字層データにその文字層の色情報を付与する。

ここで、図３を用いて、出力ファイル形成モジュール１３０によって形成される出力ファイル３００のデータ構造の例を説明する。
出力ファイル３００は、Ｎ個の文字層データと、それに対応するＮ個の色情報と、多値画像であるバックグラウンド層データがまとめられている。具体的には、バックグラウンド層データ３９９、文字色１３０１Ａ、文字層データ１３０１Ｂ、文字色２３０２Ａ、文字層データ２３０２Ｂ、文字色Ｎ３０ＮＡ、文字層データＮ３０ＮＢを有している。文字層データと色情報の対はＮ個ある。文字色１３０１Ａ、文字色２３０２Ａ、文字色Ｎ３０ＮＡは、各々文字層処理モジュール１２１、１２２、１２Ｎから渡された文字層データであり、それに対応する文字層データ１３０１Ｂ、文字層データ２３０２Ｂ、文字層データＮ３０ＮＢは、Ｎ層分離モジュール１１０から渡された色情報であり、バックグラウンド層データ３９９は、多値バックグラウンド層処理モジュール１２９から渡された符号化データである。

また、文字層データは、各々の文字層処理モジュールによる処理結果であるベクトル情報、つまり２値画像をそのままアウトライン化したものであってもよい。又は、第１−２の実施の形態によって生成される出力ファイルであってもよい。より具体的には、第３の実施の形態で説明する文字層データ２７１０であってもよい。

図２に示すフローチャートを用いて、第１−１の実施の形態による処理例を説明する。
ステップＳ２０２では、Ｎ層分離モジュール１１０が、多値画像からベクトル化の対象となる画像、つまり文字層を２値画像として抽出する。
ステップＳ２０４では、Ｎ層分離モジュール１１０が、各文字層の色情報を抽出する。
ステップＳ２０６では、Ｎ層分離モジュール１１０が、多値画像であるバックグラウンド層を抽出する。
ステップＳ２０８では、文字層処理モジュール１２１、１２２、１２Ｎが、ステップＳ２０２で抽出された各文字層に対して、ベクトル化処理を行う。
ステップＳ２１０では、多値バックグラウンド層処理モジュール１２９が、ステップＳ２０６で抽出されたバックグラウンド層に対して、符号化処理を行う。
ステップＳ２１２では、出力ファイル形成モジュール１３０が、ステップＳ２０８での各々の結果にステップＳ２０４で抽出された色情報を付与し、ステップＳ２１０での結果を合成して出力ファイルを形成する。
なお、第１−１の実施の形態による処理例を図２に示すフローチャートを用いて説明したが、必ずしもこの順序である必要はなく、例えば、ステップＳ２０２〜ステップＳ２０６の処理はどのような順序であってもよく、また、平行的に処理を行うようにしてもよい。ステップＳ２０８とステップＳ２１０の処理についても同様である。

＜第１−１−１の実施の形態〜第１−１−４の実施の形態＞
第１−１の実施の形態の文字層処理モジュールの具体的な構成を、第１−１−１の実施の形態〜第１−１−４の実施の形態を用いて説明する。つまり、第１−１−１の実施の形態〜第１−１−４の実施の形態を、第１−１の実施の形態の文字層処理モジュールとして組み入れた形となる。
第１−１−１の実施の形態〜第１−１−４の実施の形態に示す入力画像は、各文字層処理モジュールの入力画像（２値画像）である。つまり、Ｎ層分離モジュール１１０から渡された２値画像である。また、第１−１−１の実施の形態〜第１−１−４の実施の形態に示す出力ファイルは、各文字層処理モジュールの出力データである文字層データである。ただし、必ずしもファイルとなっている必要はなく、例えば、メモリ内に記憶して、出力ファイル形成モジュール１３０に渡すようにしてもよい。

＜第１−１−１の実施の形態＞
図４は、第１−１−１の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−１の実施の形態は、図４に示すように、文字切り出しモジュール４１０、文字コード決定モジュール４２０、フォント登録モジュール４３０、出力ファイル形成モジュール４４０を有している。
文字切り出しモジュール４１０は、図４に示すように、文字コード決定モジュール４２０、フォント登録モジュール４３０、出力ファイル形成モジュール４４０と接続されており、入力画像から文字画像（画素の塊）を切り出す。切り出した文字画像を文字コード決定モジュール４２０、フォント登録モジュール４３０へ渡し、切り出した文字画像の文字サイズ（画素の塊のサイズ）と入力画像における位置を出力ファイル形成モジュール４４０へ渡す。

文字コード決定モジュール４２０は、図４に示すように、文字切り出しモジュール４１０、フォント登録モジュール４３０、出力ファイル形成モジュール４４０と接続されており、文字切り出しモジュール４１０によって切り出された文字画像に対して、その文字画像を一意に識別できる文字コードを割り当てる（決定する）。この割り当てとしては、入力画像内で一意に識別できるようにすれば、どのような方法でもよい。例えば、出現順に文字コードを割り当てるようにしてもよい。ただし、本実施の形態による処理結果をワープロのような文字処理用のソフトウエア等で用いる場合は、エスケープコードなどを割り当てないようにするとよい。また、文字認識を行って、ＪＩＳ等の文字コードを割り当ててもよいし、その文字コード体系にはない文字形状として外字コードを割り当てるようにしてもよい。なお、入力画像を再現することに、文字認識の精度は依存しない。
割り当てた文字コードをフォント登録モジュール４３０、出力ファイル形成モジュール４４０へ渡す。

フォント登録モジュール４３０は、図４に示すように、文字切り出しモジュール４１０、文字コード決定モジュール４２０、出力ファイル形成モジュール４４０と接続されており、文字切り出しモジュール４１０によって切り出された文字画像と文字コード決定モジュール４２０によって割り当てられた文字コードを関連付ける。つまり、文字コードに対応する文字画像（アウトライン化されたもの、つまり、アウトラインデータを含む）をフォントファイル形式で登録（フォントファイルを作成）する。つまり、後にその文字コードによって、フォントを参照できるようにし、文字コード、位置、文字サイズを指定すれば、元の画像が再現できるようにする。登録したフォントファイルを出力ファイル形成モジュール４４０へ渡す。

出力ファイル形成モジュール４４０は、図４に示すように、文字切り出しモジュール４１０、文字コード決定モジュール４２０、フォント登録モジュール４３０と接続されており、文字切り出しモジュール４１０によって切り出された文字画像の文字サイズと位置、文字コード決定モジュール４２０によって決定された文字コード、フォント登録モジュール４３０によって登録されたフォントファイルを受け取り、これらを一つのファイルにまとめる（形成する）。そのファイルをさらに符号化してもよい。
なお、各文字コードに対して、全てに文字サイズと位置が必要なわけではない。相対的にサイズと位置が決定できる場合には、必要な部分のみを指定すればよい。例えば、文字サイズが変化しない場合は、最初の１回のみ指定すればよい。あるいは、Ｙ座標が変化しない場合には、Ｘ座標のみを指定すればよい。あるいは、フォントのサイズが固定されている場合には、サイズを指定する必要はない。
出力ファイル形成モジュール４４０でまとめたファイルは、出力ファイルとして出力される。このファイル形式としては、フォント情報を含めることができるものであればよく、例えばＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）（登録商標）を挙げることができる。

次に、第１−１−１の実施の形態による作用・働き（動作）を説明する。図５に示すフローチャートを用いて、第１−１−１の実施の形態による処理例を説明する。
ステップＳ５０２では、文字切り出しモジュール４１０が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップＳ５０４では、文字コード決定モジュール４２０が、ステップＳ５０２で切り出された各文字画像に文字コードを割り当てる。
ステップＳ５０６では、フォント登録モジュール４３０が、ステップＳ５０２で切り出された文字画像とステップＳ５０４で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップＳ５０８では、出力ファイル形成モジュール４４０が、ステップＳ５０２で抽出された文字サイズと位置、ステップＳ５０４で割り当てられた文字コード、ステップＳ５０６で作成されたフォントファイルをまとめて、出力ファイルを形成する。
なお、ステップＳ５０２で、全ての文字画像を切り出したが、１つの文字画像を切り出して、ステップＳ５０４〜ステップＳ５０８の処理を行ってもよい。その場合、ステップＳ５０２〜ステップＳ５０８までを繰り返して処理を行うことになる。

＜第１−１−２の実施の形態＞
図６は、第１−１−２の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−２の実施の形態は、第１−１−１の実施の形態に代表文字決定モジュール６２０を付加したものである。
文字切り出しモジュール６１０は、図６に示すように、代表文字決定モジュール６２０、出力ファイル形成モジュール６５０と接続されており、その機能は第１−１−１の実施の形態の文字切り出しモジュール４１０と同等であり、切り出した文字画像を代表文字決定モジュール６２０へ渡し、切り出した文字画像の文字サイズと入力画像における位置を出力ファイル形成モジュール６５０へ渡す。

代表文字決定モジュール６２０は、図６に示すように、文字切り出しモジュール６１０、文字コード決定モジュール６３０、フォント登録モジュール６４０と接続されており、文字切り出しモジュール６１０で切り出された文字画像同士を比較して、類似する形状の文字画像をまとめる。つまり、代表文字決定モジュール６２０は、２値画像内の文字画像と他の文字画像との相似度に基づいて、代表画像を生成する。
文字画像間の相似度を検証して代表文字を決定する方式として以下を例に挙げる。
（１）切り出された文字画像である２枚の２値画像を入力する。
（２）２枚の入力画像の黒画素の重心をあわせる。
（３）重心をあわせた２枚の入力画像のＸＯＲ（ｅＸｃｌｕｓｉｖｅＯＲ：排他的論理和）演算を行う。
（４）ＸＯＲ演算の結果、１となった画素（相違する画素）の個数を数える。この個数が閾値以下であれば、類似する文字画像であると判断する。
（５）切り出された文字画像に対して、他の文字画像との相似度を前記の手法で計算し、次々に似ている文字画像をまとめる。
（６）このように似ている文字画像を共通化して、代表文字を生成する。
つまり、代表文字を生成することによって、入力画像の中から一部の画像データである文字画像を共通化している。具体的には、文字画像を共通化するとは、前述したように、複数の文字画像から１つの共通した代表文字を生成すること、又は複数の文字画像の中から１つの文字画像を代表文字として選択すること等がある。
したがって、代表文字としては、例えば、似ている文字画像の平均値を計算し、それを２値化した文字画像、又は、似ている文字画像の中から１つを選択したもの等となる。

なお、文字画像が類似するか否かの判定として、前述した他に、例えば、切り出された文字画像を１つのベクトルデータとして扱い、クラスタリングを行い、当該文字画像と類似する文字画像を抽出してもよい。この場合、当該文字画像を表すベクトルデータと判定対象の文字画像を表すベクトルデータとの距離（例えば、ユークリッド距離等）が所定値以下（すなわち、２つのベクトルデータの距離が近いとき）の場合は、当該文字画像と判定対象の文字画像とが類似していると判定する。
さらに、２つの文字画像パターンの論理演算の結果画像に基づいて膨張画像を生成し、その膨張画像と重なり合う割合に基づいて、類似しているか否かを判定するようにしてもよい。つまり、完全に一致する場合の膨張させる度合い（膨張半径）によって、相違度を判定するようにしてもよい。
この他に、特開平０７−２００７４５号公報、I. H. Witten, A.Moffat, and T. C. Bell 著「Managing Gigabytes」 Morgan Kaufmmann Publishers pp.320-332.等に記載されている方法を用いてもよい。

なお、類似度とは、２つの画像が合同である場合に最大となり、相違する度合いに応じて減少する量のことである。
類似度の代わりに、２つの画像が合同である場合に最小となり、相違する度合いに応じて増加する量を用いてもよい。この場合は、「距離」又は「相違度」と呼ばれる。距離とは、画像をベクトルで表した場合（画素値そのものをベクトルとする、又は画像の特徴量をベクトルとする等）に、ベクトルで表現した画像を空間内に配置し、その空間内での各画像同士の隔たり（距離）のことである。例えば、ユークリッド距離、マンハッタン距離、ハウスドルフ距離、マハラノビス距離、ベクトル間の角度θ、ｃｏｓθ、ｃｏｓθの２乗等がある。
相似度という用語は、類似度、距離又は相違度という用語を含んで用いる。したがって、「相似度に基づいて、代表画像を生成する」という場合は、類似度が高いものを用いて代表画像を生成する、又は距離が近いもの（相違度が低いもの）を用いて代表画像を生成するの意が含まれる。なお、以下、「高い、低い、近い、大きい、類似」等の比較の判断は、閾値との比較によって行う。また、閾値は、予め定めたもの、又は状況（２値画像内の画像の状況等）に応じて決定するようなものであってもよい。２値画像内の画像の状況としては、例えば、文字画像の大きさ等がある。

文字コード決定モジュール６３０は、図６に示すように、代表文字決定モジュール６２０、フォント登録モジュール６４０、出力ファイル形成モジュール６５０と接続されており、入力する文字画像が代表文字決定モジュール６２０によって生成された代表文字である以外は、第１−１−１の実施の形態の文字コード決定モジュール４２０と同等である。ただし、類似する文字画像の代表文字に対してのみ文字コードの割り当て（文字認識を含む）を行っている。つまり、類似する文字画像に対しては、同じ文字コードを割り当てている。
フォント登録モジュール６４０は、図６に示すように、代表文字決定モジュール６２０、文字コード決定モジュール６３０、出力ファイル形成モジュール６５０と接続されており、入力する文字画像が代表文字決定モジュール６２０によって生成された代表文字である以外は、第１−１−１の実施の形態のフォント登録モジュール４３０と同等である。ただし、類似する文字画像（入力画像内に複数出現している文字画像）に対して、１つの文字コードが割り当てられ、その１つの文字コードには１つのフォントが対応していることになる。
出力ファイル形成モジュール６５０は、図６に示すように、文字切り出しモジュール６１０、文字コード決定モジュール６３０、フォント登録モジュール６４０と接続されており、第１−１−１の実施の形態の出力ファイル形成モジュール４４０と同等である。ただし、類似する文字画像に対して、１つのフォントが対応している。したがって、出力ファイル形成モジュール６５０が形成した出力ファイルを用いて、元の画像（入力画像）を再現する場合、１つのフォントを複数回（入力画像内に類似する文字画像が出現している回数分）参照して、元の画像を描画することになる。

次に、第１−１−２の実施の形態による作用・働き（動作）を説明する。図７に示すフローチャートを用いて、第１−１−２の実施の形態による処理例を説明する。
ステップＳ７０２では、文字切り出しモジュール６１０が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップＳ７０４では、代表文字決定モジュール６２０が、ステップＳ７０２で切り出された文字画像から代表文字を決定する。
ステップＳ７０６では、文字コード決定モジュール６３０が、ステップＳ７０４で決定された代表文字に文字コードを割り当てる。
ステップＳ７０８では、フォント登録モジュール６４０が、ステップＳ７０４で決定された代表文字とステップＳ７０６で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップＳ７１０では、出力ファイル形成モジュール６５０が、ステップＳ７０２で抽出された文字サイズと位置、ステップＳ７０６で割り当てられた文字コード、ステップＳ７０８で作成されたフォントファイルをまとめて、出力ファイルを形成する。

＜第１−１−３の実施の形態＞
図８は、第１−１−３の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−３の実施の形態は、第１−１−２の実施の形態に拡大モジュール８４０を付加したものである。
文字切り出しモジュール８１０は、図８に示すように、代表文字決定モジュール８２０、出力ファイル形成モジュール８６０と接続されており、第１−１−２の実施の形態の文字切り出しモジュール６１０と同等である。
代表文字決定モジュール８２０は、図８に示すように、文字切り出しモジュール８１０、文字コード決定モジュール８３０、拡大モジュール８４０と接続されており、決定した代表文字を拡大モジュール８４０へ渡すこと以外は、第１−１−２の実施の形態の代表文字決定モジュール６２０と同等である。

拡大モジュール８４０は、図８に示すように、代表文字決定モジュール８２０、フォント登録モジュール８５０と接続されており、代表文字決定モジュール８２０によって決定された代表文字を受け取り、その代表文字の拡大代表文字（高解像度化した文字画像）を生成する。つまり、入力画像全体に対して拡大を行うわけではなく、代表文字決定モジュール８２０によって代表文字を決定した後に、その代表文字画像を拡大する。この生成方法については、図１０を用いて後述する。そして、拡大代表文字をフォント登録モジュール８５０へ渡す。
文字コード決定モジュール８３０は、図８に示すように、代表文字決定モジュール８２０、フォント登録モジュール８５０、出力ファイル形成モジュール８６０と接続されており、第１−１−２の実施の形態の文字コード決定モジュール６３０と同等である。

フォント登録モジュール８５０は、図８に示すように、文字コード決定モジュール８３０、拡大モジュール８４０、出力ファイル形成モジュール８６０と接続されており、入力する文字画像が拡大モジュール８４０によって拡大された代表文字である以外は、第１−１−２の実施の形態のフォント登録モジュール６４０と同等である。
なお、フォント登録モジュール８５０は、次のような処理を行ってもよい。
異なる代表文字画像に対して、文字コード決定モジュール８３０によって（特に文字認識を行った場合）同じ文字コードが付されることもありえる。この場合、各々の代表文字を別のフォント種として登録してもよい。
つまり、次のように行う。
（１）フォント種Ｘ（Ｘ＝０，１，２，．．．）を登録するとする。
（２）代表文字画像の文字認識を行い、文字コードがＹとなったとする。この文字コードＹの文字画像を、フォント種Ｘに登録する。ただし、フォント種Ｘは、文字コードＹが登録されていないフォント種Ｘの中で、最もＸの値が小さいものとする。
（２−１）すなわち、文字コードＹが初めて出現した場合は、フォント種０に登録する。
（２−２）フォント種０，１，．．．Ｎ−１に文字コードＹが登録されている場合、フォント種Ｎに文字コードＹを登録する。

出力ファイル形成モジュール８６０は、図８に示すように、文字切り出しモジュール８１０、文字コード決定モジュール８３０、フォント登録モジュール８５０と接続されており、第１−１−２の実施の形態の出力ファイル形成モジュール６５０と同等である。

図９を用いて、第１−１−３の実施の形態の処理例を説明する。
文字切り出しモジュール８１０は、複数の「２」という文字が記載された入力画像９１０を対象画像とする。文字切り出しモジュール８１０は、図９に示すように、文字画像９１１、文字画像９１２、文字画像９１３を文字画像９１１の解像度で切り出す。そして、文字サイズ／文字位置データ９５０を抽出する。
代表文字決定モジュール８２０は、これらの複数の「２」という文字画像が類似していると判定する。
文字コード決定モジュール８３０は、「２」という文字画像の文字コード・データ９４０を割り当てる。
拡大モジュール８４０は、文字画像９１１、文字画像９１２、文字画像９１３の重点（重心線９１１Ａ等の交差点）を求め、その重点を一致させるように位相を移動して高解像度文字画像９２０を生成する。
フォント登録モジュール８５０は、高解像度文字画像９２０からアウトライン情報であるフォント・データ９３０を生成する。
出力ファイル形成モジュール８６０は、フォント・データ９３０、文字コード・データ９４０、文字サイズ／文字位置データ９５０から出力ファイルを形成する。

図１０を用いて、拡大モジュール８４０の処理例を説明する。
図１０（Ａ）は、入力画像９１０の解像度（第１の解像度）における標本化格子（第１の標本化格子１００１、第１の標本化格子１００２、第１の標本化格子１００３、第１の標本化格子１００４）及び文字画像の重心位置（重心１００１Ａ、重心１００２Ａ、重心１００３Ａ、重心１００４Ａ）を表している。
拡大モジュール８４０は、まず、図１０（Ｂ）に示すように、文字画像の重心に基づいて、４つの標本化格子の位相を移動させる。つまり、重心１００１Ａ、重心１００２Ａ、重心１００３Ａ、重心１００４Ａを重心１００５に一致させて、図１０（Ｂ）のような画像を生成する。

図１０（Ｃ）、図１０（Ｄ）は、第１の解像度よりも高い第２の解像度の標本化格子を設定する手法の例を説明する図である。図１０（Ｃ）に記載された丸数字（１、２、３、４）は、第１の解像度における文字画像の値を例示している。ここで、文字画像は、丸数字が第１の解像度における標本化格子の格子点上に表されるようにプロットされている。
図１０（Ｄ）において、第２の標本化格子１００６は高解像度画像の標本化格子である。
拡大モジュール８４０は、第１の解像度における４つの標本化格子の位相が移動されると、図１０（Ｃ）に示すように、第２の解像度における標本化格子を設定し、図１０（Ｄ）に示すように、文字画像の重心が一致するように、第２の解像度における標本化格子の位相を移動させる。

図１０（Ｅ）は、第２の解像度における文字画像の値を算出する手法の例を説明する図である。第２の標本化格子１００６Ａ、第２の標本化格子１００６Ｂ、第２の標本化格子１００６Ｃ、第２の標本化格子１００６Ｄ内の中心にある丸数字は、第２の解像度における文字画像の値を例示しているものである。ここで、第２の解像度における文字画像は、中心にある丸数字が、第２の解像度における標本化格子の格子点上に表されるように示されている。
そして、拡大モジュール８４０は、第１の解像度における各文字画像の位相に基づいて、その各文字画像の画素値から、第２の解像度における文字画像の画素値を補間する。本例では、拡大モジュール８４０は、最近傍補間法を適用して、第２の解像度における文字画像の画素値を補間する。すなわち、拡大モジュール８４０は、第１の解像度における文字画像の４つの値（図１０（Ｅ）では、丸数字の１、２、３、４）のうち、第２の解像度における標本化格子点に最も近い値を選択して、第２の解像度における文字画像の値とする。具体的には、第２の標本化格子１００６Ａでは、中心に最も近い値は「１」であり、「１」を採用している（丸数字は１である）。なお、補間方法は、この方法に限定されるものではなく、その他の方法（例えば、線形補間法など）を適用してもよい。
なお、拡大モジュール８４０の処理は、前述の処理に限られず、線形補間、キュービックコンボリューション等でもよい。

次に、第１−１−３の実施の形態による作用・働き（動作）を説明する。図１１に示すフローチャートを用いて、第１−１−３の実施の形態による処理例を説明する。
ステップＳ１１０２では、文字切り出しモジュール８１０が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップＳ１１０４では、代表文字決定モジュール８２０が、ステップＳ１１０２で切り出された文字画像から代表文字を決定する。
ステップＳ１１０６では、文字コード決定モジュール８３０が、ステップＳ１１０４で決定された代表文字に文字コードを割り当てる。
ステップＳ１１０８では、拡大モジュール８４０が、ステップＳ１１０４で決定された代表文字を拡大する。
ステップＳ１１１０では、フォント登録モジュール８５０が、ステップＳ１１０８で拡大された代表文字とステップＳ１１０６で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップＳ１１１２では、出力ファイル形成モジュール８６０が、ステップＳ１１０２で抽出された文字サイズと位置、ステップＳ１１０６で割り当てられた文字コード、ステップＳ１１１０で作成されたフォントファイルをまとめて、出力ファイルを形成する。

＜第１−１−４の実施の形態＞
図１２は、第１−１−４の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−４の実施の形態は、第１−１−３の実施の形態とは、文字コード決定モジュール１２４０が拡大代表文字に対して文字コードを決定するようにしたことが異なる。
文字切り出しモジュール１２１０は、図１２に示すように、代表文字決定モジュール１２２０、出力ファイル形成モジュール１２６０と接続されており、第１−１−３の実施の形態の文字切り出しモジュール８１０と同等である。
代表文字決定モジュール１２２０は、図１２に示すように、文字切り出しモジュール１２１０、拡大モジュール１２３０と接続されており、拡大モジュール１２３０にのみ代表文字を渡すこと以外は、第１−１−３の実施の形態の代表文字決定モジュール８２０と同等である。

拡大モジュール１２３０は、図１２に示すように、代表文字決定モジュール１２２０、文字コード決定モジュール１２４０、フォント登録モジュール１２５０と接続されており、拡大代表文字を文字コード決定モジュール１２４０にも渡す以外は、第１−１−３の実施の形態の拡大モジュール８４０と同等である。
文字コード決定モジュール１２４０は、図１２に示すように、拡大モジュール１２３０、フォント登録モジュール１２５０、出力ファイル形成モジュール１２６０と接続されており、拡大モジュール１２３０によって拡大された代表文字を受け取り、その代表文字の文字コードを割り当てる。代表文字は高解像度化が行われており、例えば、文字コードの割り当てとして文字認識を行わせ、誤認識の少ない文字認識を行わせるようにしてもよい。そして、その文字コードをフォント登録モジュール１２５０、出力ファイル形成モジュール１２６０へ渡す。
フォント登録モジュール１２５０は、図１２に示すように、拡大モジュール１２３０、文字コード決定モジュール１２４０、出力ファイル形成モジュール１２６０と接続されており、第１−１−３の実施の形態のフォント登録モジュール８５０と同等である。
出力ファイル形成モジュール１２６０は、図１２に示すように、文字切り出しモジュール１２１０、文字コード決定モジュール１２４０、フォント登録モジュール１２５０と接続されており、第１−１−３の実施の形態の出力ファイル形成モジュール８６０と同等である。

次に、第１−１−４の実施の形態による作用・働き（動作）を説明する。図１３に示すフローチャートを用いて、第１−１−４の実施の形態による処理例を説明する。
ステップＳ１３０２では、文字切り出しモジュール１２１０が、入力画像から全ての文字画像を切り出し、その文字画像の文字サイズと位置を抽出する。
ステップＳ１３０４では、代表文字決定モジュール１２２０が、ステップＳ１３０２で切り出された文字画像から代表文字を決定する。
ステップＳ１３０６では、拡大モジュール１２３０が、ステップＳ１３０４で決定された代表文字を拡大する。
ステップＳ１３０８では、文字コード決定モジュール１２４０が、ステップＳ１３０６で拡大された代表文字に文字コードを割り当てる。
ステップＳ１３１０では、フォント登録モジュール１２５０が、ステップＳ１３０６で拡大された代表文字とステップＳ１３０８で割り当てられた文字コードとを対応付けてフォントファイルを生成する。
ステップＳ１３１２では、出力ファイル形成モジュール１２６０が、ステップＳ１３０２で抽出された文字サイズと位置、ステップＳ１３０８で割り当てられた文字コード、ステップＳ１３１０で作成されたフォントファイルをまとめて、出力ファイルを形成する。

なお、第１−１−１の実施の形態〜第１−１−４の実施の形態では、文字コードを用いているが、文字コードの代わりにフォントコードを用いるようにしてもよい。なお、フォントコードとは、切り出した文字画像を一意に識別する識別符号である。つまり、フォントコードと文字画像との対応表を生成し、フォントコードを用いてその対応表から文字画像を抽出することによって、原画像を生成することができる。具体的には、例えば、文字画像の出現順に番号を付すようにしてもよい。

＜第１−２の実施の形態＞
図１４は、第１−２の実施の形態の構成例についての概念的なモジュール構成図である。
第１−１の実施の形態では、各文字層処理モジュールでフォント登録処理、文字コード決定処理をそれぞれ行っていたが、これを１つにまとめたものである。
第１−２の実施の形態は、Ｎ層分離モジュール１４１０、文字層処理モジュール１４２１、文字層処理モジュール１４２２、文字層処理モジュール１４２Ｎ、多値バックグラウンド層処理モジュール１４２９、出力ファイル形成モジュール１４３０、統一フォント処理モジュール１４４０を有している。

Ｎ層分離モジュール１４１０は、文字層処理モジュール１４２１、文字層処理モジュール１４２２、文字層処理モジュール１４２Ｎ、多値バックグラウンド層処理モジュール１４２９、出力ファイル形成モジュール１４３０と接続されており、その機能は第１−１の実施の形態のＮ層分離モジュール１１０と同等である。
多値バックグラウンド層処理モジュール１４２９は、Ｎ層分離モジュール１４１０、出力ファイル形成モジュール１４３０と接続されており、その機能は第１−１の実施の形態の多値バックグラウンド層処理モジュール１２９と同等である。
出力ファイル形成モジュール１４３０は、Ｎ層分離モジュール１４１０、文字層処理モジュール１４２１、文字層処理モジュール１４２２、文字層処理モジュール１４２Ｎ、多値バックグラウンド層処理モジュール１４２９、統一フォント処理モジュール１４４０と接続されており、その機能は第１−１の実施の形態の出力ファイル形成モジュール１３０と同等であり、出力ファイル３００を形成する。

統一フォント処理モジュール１４４０は、文字層処理モジュール１４２１、１４２２、１４２Ｎ、出力ファイル形成モジュール１４３０と接続されている。
統一フォント処理モジュール１４４０内には、第１−１の実施の形態の文字層処理モジュール（１２１、１２２、１２Ｎ）内のフォント登録モジュール（第１−１−１の実施の形態〜第１−１−４の実施の形態のフォント登録モジュール４３０、６４０、８５０、１２５０に該当）、文字コード決定モジュール（第１−１−１の実施の形態〜第１−１−４の実施の形態の文字コード決定モジュール４２０、６３０、８３０、１２４０に該当）を有している。つまり、第１−１の実施の形態で各文字層処理モジュールが行っているフォント登録処理、文字コード決定処理を、統一フォント処理モジュール１４４０内に一つにまとめたものである。そして、その処理結果を各文字層処理モジュール（１４２１、１４２２、１４２Ｎ）に返している。

さらに、統一フォント処理モジュール１４４０は、フォントコード・文字コード対応表作成モジュールを有していてもよい。つまり、第１−１の実施の形態では、文字コードをフォントコードと同等に用いているが、フォントコードは文字画像（アウトラインデータを含む）を識別するための識別子として用い、そのフォントコードと文字認識の結果である文字コードとを対応させるフォントコード・文字コード対応表を作成する。そして、そのフォントコード・文字コード対応表を出力ファイル形成モジュール１４３０に渡す。出力ファイル形成モジュール１４３０は、フォントコード・文字コード対応表を含めた出力ファイルを形成する。これによって、出力ファイルを受け取った画像処理装置では、フォントコード・文字コード対応表内の文字コードに対応するフォントコードを抽出し、さらにそのフォントコードから文字画像を生成して画像を再生する。

さらに、統一フォント処理モジュール１４４０は、第１−１−１の実施の形態〜第１−１−４の実施の形態の出力ファイル形成モジュール４４０、６５０、８６０、１２６０に該当するモジュールを有していてもよい。つまり、各文字層データを生成して、出力ファイル形成モジュール１４３０に渡すようにしてもよい。その場合、出力ファイル形成モジュール１４３０は、各文字層処理モジュール１４２１、１４２２、１４２Ｎから文字層データを受け取る代わりに、統一フォント処理モジュール１４４０から各文字層データを受け取り、出力ファイル３００を形成する。

文字層処理モジュール１４２１、１４２２、１４２Ｎは、Ｎ層分離モジュール１４１０、出力ファイル形成モジュール１４３０、統一フォント処理モジュール１４４０と接続されている。これらは、第１−１の実施の形態の文字層処理モジュール１２１、１２２、１２Ｎに対応する。ただし、フォント登録モジュール（第１−１−１の実施の形態〜第１−１−４の実施の形態のフォント登録モジュール４３０、６４０、８５０、１２５０）、文字コード決定モジュール（第１−１−１の実施の形態〜第１−１−４の実施の形態の文字コード決定モジュール４２０、６３０、８３０、１２４０）がないものである。フォント登録モジュール、文字コード決定モジュールは、統一フォント処理モジュール１４４０に含まれている。

図１４に示した第１−２の実施の形態による処理例については、図２に示したフローチャートを流用して説明する。第１−２の実施の形態による処理例は、図２に示したフローチャートのステップＳ２００からステップＳ２０６までの処理、ステップＳ２１０からステップＳ２１４までの処理と同等である。
ステップＳ２０８では、統一フォント処理モジュール１４４０による処理が付加される。つまり、第１−１−１の実施の形態〜第１−１−４の実施の形態による処理（文字切り出し処理、代表文字決定処理、拡大処理等）を行い、各文字層処理モジュール内のフォント登録処理、文字コード決定処理をまとめた統一フォント処理モジュール１４４０による処理を行う。

＜第１−３の実施の形態＞
次に第１−３の実施の形態について説明する。
第１−１の実施の形態、第１−２の実施の形態では、Ｎ個の２値画像データは、それぞれ文字だけからなる画像であるとして処理を行っている。しかし、入力画像又はＮ層分離モジュール１１０、１４１０の処理によっては、文字ではない２値画像も含まれる場合がある。そこで、第１−３の実施の形態では、Ｎ個の２値画像データをさらに文字画像と文字画像以外の画像データに分け、その文字画像、文字画像以外の画像データに適した処理を行うことで、文字層処理モジュール内での文字画像に対する処理の負荷を減らし、処理後の情報量を少なくする。

第１−３の実施の形態は、第１−１の実施の形態又は第１−２の実施の形態における文字層処理モジュール（１２１、１２２、１２Ｎ、１４２１、１４２２、１４２Ｎ）を、図１５に示すモジュール構成にしたものである。つまり、図１５に示すモジュール構成を、第１−１の実施の形態又は第１−２の実施の形態の文字層処理モジュールとして組み入れた形となる。

第１−３の実施の形態における文字層処理モジュールは、図１５に示すように、文字切り出しモジュール１５０１、文字層出力モジュール１５０２、２値画像層出力モジュール１５０３、出力ファイル形成モジュール１５０４を有している。
文字切り出しモジュール１５０１は、文字層出力モジュール１５０２、２値画像層出力モジュール１５０３と接続されており、入力画像データの中から、ベクトル情報に変換する画像である文字画像（画素の塊）を切り出し（抽出し）、切り出した文字画像、その文字画像の文字サイズと位置を文字層出力モジュール１５０２へ渡す。そして、文字画像以外の画像を２値画像層出力モジュール１５０３へ渡す。
また、文字画像を抽出するのに、文字認識ソフトウエアなどを利用してもよい。例えば、ひらがなの「い」の画像は、２つの連結画素領域の集合である。このような文字を認識するためには、複数の連結画素成分をまとめる必要がある。文字画像を抽出するために、文字認識ソフトウエアなどを利用して、その文字認識ソフトウエアが抽出した文字矩形を用いて文字画像を抽出するようにしてもよい。そして、文字として認識できた矩形以外の部分を、文字画像以外の画像として２値画像層出力モジュール１５０３へ渡すようにしてもよい。

文字層出力モジュール１５０２は、文字切り出しモジュール１５０１、出力ファイル形成モジュール１５０４と接続されており、文字切り出しモジュール１５０１から切り出した文字画像、その文字画像の文字サイズと位置を受け取り、文字画像をベクトル情報に変換して、出力ファイルを形成する文字層のデータを生成する。そして、出力ファイル形成モジュール１５０４へそのデータを渡す。

２値画像層出力モジュール１５０３は、文字切り出しモジュール１５０１、出力ファイル形成モジュール１５０４と接続されており、文字切り出しモジュール１５０１から文字画像以外の画像を受け取り、出力ファイルを形成する２値画像層のデータを生成する。そして、出力ファイル形成モジュール１５０４へそのデータを渡す。
２値画像層出力モジュール１５０３では、例えば、２値画像を符号化して、２値画像層のデータを出力する。２値画像層のデータとしては、ＣＣＩＴＴＧ３、ＣＣＩＴＴＧ４、ＪＢＩＧ、ＪＢＩＧ２などの２値画像用圧縮方式を用いて作成すればよい。又は、ＬＺなどの他の方式を用いて圧縮してもよい。あるいは、単なる無圧縮のビット列としてもよい。

出力ファイル形成モジュール１５０４は、文字層出力モジュール１５０２、２値画像層出力モジュール１５０３と接続されており、文字層出力モジュール１５０２から文字層のデータを、２値画像層出力モジュール１５０３から２値画像層のデータを、それぞれ受け取って出力ファイルを形成する。
出力ファイルのデータ構造を図１８に示す。出力ファイル１８００は、文字層データ１８０１と２値画像層データ１８０２を有している。つまり、出力ファイル１８００は、文字切り出しモジュール１５０１が受け付けた画像データの中から、同等の画素の塊をまとめた代表の画素の塊を変換したベクトル情報である文字層データ１８０１と、前記画像データの中から、前記ベクトル情報としては変換されなかった２値画像層データ１８０２により構成されている。
出力ファイル１８００の形式として、例えばＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）（登録商標）を用いてもよい。なお、ＰＤＦの形式（フォーマット）を用いることを説明しているのであって、ＰＤＦ内のデータとして、文字層データ１８０１、２値画像層データ１８０２のデータ構造の例が既にあるわけではないことを留意事項として記しておく。

出力ファイル１８００を受け取ったシステムは、出力ファイル１８００内の文字層データ１８０１に対してレンダリング処理を行い、２値画像層データ１８０２を合成して、文字切り出しモジュール１５０１が受け付けた入力画像と同等の画像を生成する。なお、入力画像と同等の画像とは、その入力画像と同一の画像の他に多少の改変がなされたものであってもよい。

図１６は、図１５に示した第１−３の実施の形態における文字切り出しモジュール１５０１内の構成例についての概念的なモジュール構成図である。
文字切り出しモジュール１５０１は、画素塊抽出モジュール１６０１、画素塊サイズ検証モジュール１６０２、画素塊消去モジュール１６０３を有している。
画素塊抽出モジュール１６０１は、画素塊サイズ検証モジュール１６０２と接続されており、入力画像から画素塊を抽出する。画素塊、その画素塊の抽出は、前述の説明の通りである。

画素塊サイズ検証モジュール１６０２は、画素塊抽出モジュール１６０１、画素塊消去モジュール１６０３と接続されており、画素塊のサイズを検証する。つまり、画素塊をベクトル化すべき画像である文字画像とそれ以外の画像に分けて、文字画像、その文字画像の文字サイズと位置を画素塊消去モジュール１６０３、文字層出力モジュール１５０２へ渡す。例えば、画素塊のサイズの検証として、以下の手法（（１）〜（３））がある。
（１）画素塊の黒画素数が閾値以上の場合は、図形などの大マークとして文字ではないと判断する。例えば、閾値として、１００００などの値を示すことができる。
（２）画素塊の黒画素数が閾値以下の場合は、ノイズなどの小マークとして文字ではないと判断する。例えば、閾値として、５などの値を示すことができる。
（３）それ以外の画素塊は、文字画像とする。文字画像、その文字サイズ（切り出し文字の画像サイズ）と入力画像内における位置を抽出し、それを画素塊消去モジュール１６０３、文字層出力モジュール１５０２へ渡す。

また、前述の例では、画素塊の黒画素の数で文字か否かを判断したが、他の方法を用いてもよい。
例えば、画素塊を包含する矩形（外接矩形）を抽出し、その矩形の横幅あるいは縦幅のいずれかが閾値より大きければ、文字以外と判断するようにしてもよい。例えば、閾値として、１０００などの値を示すことができる。
例えば、その矩形の横幅あるいは縦幅のいずれも閾値より小さければ、文字以外と判断するようにしてもよい。例えば、閾値として、３などの値を示すことができる。
さらに、前述の例での大マークを文字以外と判断しなくてもよい。
前述の例での小マークを文字以外と判断しなくてもよい。

画素塊消去モジュール１６０３は、画素塊サイズ検証モジュール１６０２と接続されており、文字画像と判断された画素塊を、入力画像から消去する。つまり、画素塊サイズ検証モジュール１６０２から文字画像、その文字サイズと位置を受け取り、入力画像から、その位置にある文字画像を消去する。文字画像を消去した後の画像を、文字以外の画像として２値画像層出力モジュール１５０３へ渡す。

図１７は、図１５に示した第１−３の実施の形態における文字層出力モジュール１５０２内の構成例についての概念的なモジュール構成図である。
文字層出力モジュール１５０２は、フォント登録モジュール１７０１、文字コード決定モジュール１７０２、文字層形成モジュール１７０３を有している。

文字コード決定モジュール１７０２は、フォント登録モジュール１７０１、文字層形成モジュール１７０３と接続されており、文字切り出しモジュール１５０１の画素塊サイズ検証モジュール１６０２から切り出し文字の画像を受け取り、それに対して文字コードを割り当てる。そして、その文字コードをフォント登録モジュール１７０１、文字層形成モジュール１７０３へ渡す。
この割り当てとしては、エスケープコードなどを割り当てないようにして、適当に割り当ててもよい。また、文字認識を行って、その文字コードを割り当ててもよいし、外字コードを割り当ててもよい。適当に割り当てる場合には、必ずしも、文字コード決定モジュール１７０２に切り出し文字の画像を入力する必要はない。

フォント登録モジュール１７０１は、文字コード決定モジュール１７０２、文字層形成モジュール１７０３と接続されており、文字切り出しモジュール１５０１の画素塊サイズ検証モジュール１６０２から切り出された文字画像と、文字コード決定モジュール１７０２からその文字画像に対応する文字コードを受け取り、フォントファイルを生成して、文字層形成モジュール１７０３へ渡す。
つまり、フォント登録モジュール１７０１は、文字コード決定モジュール１７０２で割り当てた文字コードに対応する文字形状をフォントファイル形式で登録する。フォントとしては、文字形状をアウトライン化して、アウトラインフォントとして登録してもよいし、ビットマップ形状のまま、ビットマップフォントとして登録してもよい。

文字層形成モジュール１７０３は、フォント登録モジュール１７０１、文字コード決定モジュール１７０２と接続されており、フォント登録モジュール１７０１からフォントファイル、文字コード決定モジュール１７０２から文字コード、文字切り出しモジュール１５０１の画素塊サイズ検証モジュール１６０２から文字サイズと位置を受け取り、文字層データ１８０１を生成して、出力ファイル形成モジュール１５０４へ渡す。
つまり、文字層形成モジュール１７０３は、フォント登録モジュール１７０１で生成したフォントファイル形式のデータと、文字コード決定モジュール１７０２で決定した文字コードと、各文字コードに対応する文字サイズと位置を一つのファイルにまとめる。各文字コード全てに文字サイズと位置が必要なわけではない。相対的にサイズと位置が決定できる場合には、必要な部分のみを指定すればよい。例えば、連続して文字サイズが変化しない場合は、最初の１回のみ指定すればよい。あるいは、Ｙ座標が変化しない場合には、Ｘ座標のみを指定すればよい。あるいは、フォントのサイズが固定されている場合には、サイズを指定する必要はない。
そして、これらのデータを統合して文字層データ１８０１として出力する。
なお、文字画像をアウトラインフォントとして登録する例を示したが、まず、２値画像である文字画像全体をアウトライン化して、このアウトライン情報を文字層としてもよい。

以上の動作で、文字層データと２値画像層データに分離すること、さらに文字層データと２値画像層データとで入力画像を表現する出力ファイルを形成することに関して説明した。
次に、文字層データと２値画像層データの例を図１９に示す。
入力画像データ１９００を文字切り出しモジュール１５０１が受け付ける。入力画像データ１９００を、文字画像と文字画像以外の画像に分離する。そして、文字層出力モジュール１５０２が文字層データ１９０１を、２値画像層出力モジュール１５０３が２値画像層データ１９０２を生成する。
つまり、入力画像データ１９００の文字部分（文字画像）だけ抜き出したものが文字層データ１９０１である。２値画像層は、小さな画素塊や大きな画素塊を抜き出したものであり、図１９に示す２値画像層データ１９０２となる。なお、図１９では、文字層データ１９０１は人間が見ても文字と認識できる画像になっているが、必ずしもそのような画像でなくてもよい。理解不能な形状の画素塊であっても、文字画像として抜き出すようにしてもよい。

次に、第１−３の実施の形態の変形例を説明する。
図２０は、第１−３の実施の形態の文字切り出しモジュール１５０１に該当する文字切り出しモジュール２００１内の構成例についての概念的なモジュール構成図を示している。
なお、第１−３の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第１−３の実施の形態の文字切り出しモジュール１５０１（図１５参照）では、文字画像と判断された部分を入力画像から消去して、文字画像以外の画像を抜き出したが、他の方法も可能である。つまり、文字画像以外と判断された部分を画像内に復活（描画）させることで文字以外の画像を生成してもよい。

第１−３の実施の形態の変形例は、第１−３の実施の形態における文字切り出しモジュール１５０１を図２０に示すような文字切り出しモジュール２００１にしたものである。
文字切り出しモジュール２００１は、画素塊抽出モジュール１６０１、画素塊サイズ検証モジュール２００２、画素塊復活モジュール２００３を有している。
画素塊サイズ検証モジュール２００２は、画素塊抽出モジュール１６０１、画素塊復活モジュール２００３と接続されており、画素塊のサイズを検証する。つまり、画素塊をベクトル化すべき画像である文字画像とそれ以外の画像に分けて、文字画像、その文字画像の文字サイズと位置を文字層出力モジュール１５０２へ渡し、文字画像以外の画像、その画像のサイズと位置を画素塊復活モジュール２００３へ渡す。なお、画素塊のサイズの検証手法は、第１−３の実施の形態における画素塊サイズ検証モジュール１６０２と同等である。
画素塊復活モジュール２００３は、画素塊サイズ検証モジュール２００２と接続されており、画素塊サイズ検証モジュール２００２から受け取った文字画像以外の画像、その画像のサイズと位置を用いて、文字以外の画像を生成し、２値画像層出力モジュール１５０３へ渡す。

ここで、図２１を用いて、第１−３の実施の形態（変形例を含む）における出力ファイルのデータ構造の例を説明する。
出力ファイル２１００は、Ｎ個の文字層データ及び２値画像層と、それに対応するＮ個の色情報と、多値画像であるバックグラウンド層データがまとめられている。具体的には、バックグラウンド層データ２１９９、文字色１２１０１Ａ、文字層データ１、２値画像層１２１０１Ｂ、文字色２２１０２Ａ、文字層データ２、２値画像層２２１０２Ｂ、文字色Ｎ２１０ＮＡ、文字層データＮ、２値画像層Ｎ２１０ＮＢを有している。
文字色１２１０１Ａ、文字色２２１０２Ａ、文字色Ｎ２１０ＮＡが、文字層データ及び２値画像層を有していること以外は、図３に示した第１−１の実施の形態又は第１−２の実施の形態による出力ファイル３００と同等である。

＜第２の実施の形態＞
第２の実施の形態では、まず入力画像をフォアグラウンド画像、バックグラウンド画像、及びセレクト情報（セレクト層ともいう）の３層に分離する。ここでの分離は、特許文献２に示す技術を用いてもよい。
なお、特許文献２に示す技術では、セレクト情報は、０と１の情報からなる２値情報である。このセレクト情報を用いて、画素単位で、フォアグラウンド画像か、バックグラウンド画像のいずれかを選択することになる。
第２の実施の形態は、特許文献２に示すセレクト情報の用い方とは異なる用い方をする。
すなわち、第２の実施の形態では、まずセレクト情報（２値画像情報）を、アウトライン化する。アウトライン化の方法は、通常のアウトライン化を行えばよい。すなわち、入力２値画像の黒画素（あるいは白画素）を、連結成分に分離し、各連結成分の周囲を直線あるいは曲線で表現してアウトライン化すればよい。

そして、セレクト情報を、フォアグラウンド画像のクリップ情報として用いる。つまり、画像を生成する場合は、第２の実施の形態によって処理された出力ファイルであるフォアグラウンド画像、バックグラウンド画像、及びセレクト情報を用いて、以下の順で描画を行う。
（１）バックグラウンド画像を描画する。
（２）フォアグラウンド画像を、セレクト情報であるアウトラインでクリップした画像を生成する。
（３）クリップした画像をバックグラウンド画像の上に上書き描画する。
このように描画することで、アウトライン化されたセレクト情報を用いて、特許文献２に示す技術と同等に画像を表現することが可能となる。しかも、セレクト情報がアウトライン化されているため、画素単位よりも高い精度で、フォアグラウンド画像の選択を行うことができる。
ここで、セレクト情報をアウトライン化された文字の形状とし、フォアグラウンド画像をその文字を含む領域内をその文字の色で塗り潰したものとすれば、文字毎に色の異なる画像を表現することとなる。

図２２は、第２の実施の形態の構成例についての概念的なモジュール構成図である。
３層分離モジュール２２１０、多値画像（フォアグラウンド）処理モジュール２２２１、アウトライン化モジュール２２２２、多値画像（バックグラウンド）処理モジュール２２２３、出力ファイル形成モジュール２２３０を有している。
３層分離モジュール２２１０は、多値画像（フォアグラウンド）処理モジュール２２２１、アウトライン化モジュール２２２２、多値画像（バックグラウンド）処理モジュール２２２３と接続されており、入力した多値画像を、フォアグラウンドの多値画像、セレクト情報（２値画像）、及びバックグラウンドの多値画像に分離する。例えば、特許文献２に示す技術を用いてもよい。フォアグラウンドの多値画像には、文字画像が含まれている。セレクト情報は、フォアグラウンドの多値画像を切り抜くための選択情報である２値画像である。

多値画像（フォアグラウンド）処理モジュール２２２１は、３層分離モジュール２２１０、出力ファイル形成モジュール２２３０と接続されており、３層分離モジュール２２１０からフォアグラウンドの多値画像を受け取り、ＪＰＥＧ等の多値画像符号化を行い、その結果を出力ファイル形成モジュール２２３０へ渡す。
多値画像（バックグラウンド）処理モジュール２２２３は、３層分離モジュール２２１０、出力ファイル形成モジュール２２３０と接続されており、３層分離モジュール２２１０からバックグラウンドの多値画像を受け取り、ＪＰＥＧ等の多値画像符号化を行い、その結果を出力ファイル形成モジュール２２３０へ渡す。
ただし、多値画像（フォアグラウンド）処理モジュール２２２１、多値画像（バックグラウンド）処理モジュール２２２３による多値画像符号化は行わなくてもよい。

アウトライン化モジュール２２２２は、３層分離モジュール２２１０、出力ファイル形成モジュール２２３０と接続されており、３層分離モジュール２２１０からセレクト情報を受け取る。セレクト情報は２値画像であり、アウトライン化モジュール２２２２でアウトライン化する。
アウトライン化の手法は、例えば、第１の実施の形態内の文字層処理モジュールによる文字層データの生成と同等の手法を用いてもよい。つまり、フォントとして登録する手法であり、アウトラインフォントとしてフォントファイルを作成し、さらに、文字コードを用いて、どのフォントを用いるかを指定する。アウトラインデータには、フォントファイルと、文字コードと、文字サイズ(フォントサイズ)と、文字位置が記載されることになる。又は、アウトラインデータ（アウトラインフォントを含む）としては、各種描画コマンドを用いるようにしてもよい。つまり、直線を記述する命令、ベジエ曲線を記述する命令、矩形を記述する命令等を利用し、文字画像の閉領域を記述する。又は、アウトライン化手法には様々なものがあるので、その他のアウトライン化手法を用いてもよい。つまり、２値画像の輪郭を直線や曲線で近似して、閉領域化するような手法であればよい。なお、アウトラインフォントも閉領域を記述していることになる。
なお、アウトラインデータでフォアグラウンドの多値画像を切り抜く手法として、具体的には、例えば、閉領域内をその領域に対応するフォアグラウンドの多値画像で埋めるようにすること、又は一般的にはクリップ処理と呼ばれる処理がある。
また、アウトライン化モジュール２２２２は、第１の実施の形態における文字層モジュールを含んでいてもよい。

出力ファイル形成モジュール２２３０は、多値画像（フォアグラウンド）処理モジュール２２２１、アウトライン化モジュール２２２２、多値画像（バックグラウンド）処理モジュール２２２３と接続されており、多値画像（フォアグラウンド）処理モジュール２２２１からフォアグラウンドの多値画像（符号化されていてもよいし、されていなくてもよい）、アウトライン化モジュール２２２２からセレクト情報、多値画像（バックグラウンド）処理モジュール２２２３からバックグラウンドの多値画像（符号化されていてもよいし、されていなくてもよい）を受け取り、出力ファイルを形成する。

図２３を用いて、出力ファイル２３００のデータ構造の例を説明する。
出力ファイル２３００は、バックグラウンド画像データ２３０１、フォアグラウンド画像データ２３０２、アウトラインデータ２３０３、描画記述２３０４を有している。バックグラウンド画像データ２３０１は多値画像（バックグラウンド）処理モジュール２２２３からのバックグラウンドの多値画像であり、フォアグラウンド画像データ２３０２は多値画像（フォアグラウンド）処理モジュール２２２１からのフォアグラウンドの多値画像であり、アウトラインデータ２３０３はアウトライン化モジュール２２２２からのセレクト情報である。そして、描画記述２３０４には、以下に示す各情報（（１）〜（３））を記述する。
（１）バックグラウンド画像の描画命令
（２）セレクト情報であるアウトラインデータを用いて、フォアグラウンド画像をクリップする命令
（３）クリップ後のフォアグラウンド画像をバックグラウンド画像の上に上書きする命令

＜第３の実施の形態＞
第３の実施の形態（第３−１の実施の形態〜第３−３の実施の形態を含む）の概要について説明する。
第３の実施の形態は、文字毎にその文字の色を取得して、文字毎に色情報を付与するものである。
まず、文字線画情報（２値画像）を入力画像（多値画像）から取得する。文字線画情報とは、第２の実施の形態におけるセレクト情報に対応するものであり、以下、セレクト情報ともいう。
次に文字線画情報を文字毎に分割する。そして、分割した文字毎に、その文字の色を取得する。

色の取得方法に次の２通りある。
（第１の方法）
前述した第１の実施の形態のＮ層分離モジュール１１０のように、入力画像を色毎にＮ層に分離する。そして、各文字の領域内に存在する、各々の層の画素を検出する。その検出した画素が黒（つまり、その画素は文字を構成している）である層の数が１つであれば、その層の色情報を採用する。複数の層が存在する場合、例えば、その層の色情報の平均値を取得してその色とする。第３−１の実施の形態で詳細に説明する。
（第２の方法）
各文字の領域に該当する入力画像内の画素を抽出する。そして、文字の領域内の入力画像の画素値の平均値を取得する。この平均値を、その文字の色情報とする。第３−２の実施の形態で詳細に説明する。
第１の方法又は第２の方法のように取得した文字の色情報を出力ファイル中に記載する。
文字はアウトライン化して記述する。そのアウトライン化の手法は、例えば、第１の実施の形態内の文字層処理モジュールによる文字層データの生成と同等の手法を用いてもよい。

ただし、第１の方法で、文字の領域内に存在する複数の層同士の色が極端に異なる場合、又は、第２の方法で、文字の領域内の画素値の分散が極端に大きな場合は、前記の方法をそのまま利用できない。単純に平均値を取得した場合、色が混ざってしまう危険性があるからである。この問題を回避するためには、（１）その文字画像を、アウトライン化せずにバックグラウンドの多値画像に含めること、（２）その文字画像を、第２の実施の形態と同等に、クリップし、フォアグラウンドの多値画像の色を参照するようにすること、という解決策を採ることができる。
なお、文字の領域とは、文字画像を包含する文字矩形であってもよいし、文字画像である画素塊そのものであってもよい。

＜第３−１の実施の形態＞
図２４は、第３−１の実施の形態の構成例についての概念的なモジュール構成図である。
第３−１の実施の形態は、Ｎ層分離モジュール２４１０、セレクト層形成モジュール２４２０、文字層処理モジュール２４３０、文字色決定モジュール２４４０、多値バックグラウンド層処理モジュール２４５０、出力ファイル形成モジュール２４６０を有している。
Ｎ層分離モジュール２４１０は、文字色決定モジュール２４４０、多値バックグラウンド層処理モジュール２４５０と接続されており、第１−１の実施の形態のＮ層分離モジュール１１０と同等である。つまり、入力した多値画像から色毎にフォアグラウンドの画像の２値画像及びその色情報を抽出し、文字色決定モジュール２４４０へ渡す。また、バックグラウンドの多値画像を抽出し、多値バックグラウンド層処理モジュール２４５０へ渡す。

セレクト層形成モジュール２４２０は、文字層処理モジュール２４３０と接続されており、入力した多値画像内のフォアグラウンドの画像（文字線画情報）を抽出し、２値画像に変換して文字層処理モジュール２４３０へ渡す。つまり、セレクト情報を形成して文字層処理モジュール２４３０へ渡す。セレクト情報の形成方法は、特許文献２に記載されている方法を用いてもよい。又は、Ｎ層分離モジュール２４１０によって抽出されたＮ個の２値画像（色毎の２値画像）の論理和によって生成してもよい。
文字層処理モジュール２４３０は、セレクト層形成モジュール２４２０、文字色決定モジュール２４４０と接続されており、セレクト層形成モジュール２４２０からセレクト情報を受け取り、ベクトル化してベクトル情報を生成し、文字層データとして文字色決定モジュール２４４０へ渡す。第２の実施の形態のアウトライン化モジュール２２２２と同等の処理を行う。つまり、文字画像（閉領域）毎のアウトライン情報を生成し、フォントとして登録する。

文字色決定モジュール２４４０は、Ｎ層分離モジュール２４１０、文字層処理モジュール２４３０、出力ファイル形成モジュール２４６０と接続されており、文字層処理モジュール２４３０によって生成されたベクトル情報に対応するＮ層分離モジュール２４１０によって抽出された２値画像の色に基づいて、そのベクトル情報の色情報を決定する。つまり、文字画像毎のアウトライン情報に対して色情報を付与する。そして、色情報が付与されたアウトライン情報を出力ファイル形成モジュール２４６０へ渡す。また、文字色決定モジュール２４４０は、第１の実施の形態における文字層モジュールを含んでいてもよい。
多値バックグラウンド層処理モジュール２４５０は、Ｎ層分離モジュール２４１０、出力ファイル形成モジュール２４６０と接続されており、第１−１の実施の形態の多値バックグラウンド層処理モジュール１２９と同等である。
出力ファイル形成モジュール２４６０は、文字色決定モジュール２４４０、多値バックグラウンド層処理モジュール２４５０と接続されており、多値バックグラウンド層処理モジュール２４５０によって符号化された背景の多値画像の符号化データ、文字色決定モジュール２４４０によって色情報が付与されたアウトライン情報を有するファイルを形成する。

図２５〜２８を用いて、第３−１の実施の形態における処理を説明する。
図２５は、Ｎ層分離画像とセレクト層の例を示す説明図である。
Ｎ層分離モジュール２４１０は、入力カラー画像２５１０をバックグラウンド画像とフォアグラウンド画像に分け、フォアグラウンド画像を色毎にＮ（図２５の場合は３）層に分離する。なお、図２５（Ａ）に示す入力カラー画像２５１０内の「Ａ」の文字は黒色、「Ｂ」の文字は青色、「Ｃ」の文字は赤色である。つまり、入力カラー画像２５１０は、Ｎ層分離モジュール２４１０によって、第１層２値画像２５２１、第２層２値画像２５２２、第３層２値画像２５２３、バックグラウンド画像２５２４に分離される。
そして、セレクト層形成モジュール２４２０は、入力カラー画像２５１０からセレクト層２５３０を抽出する。つまり、入力カラー画像２５１０のバックグラウンド画像以外の画像（文字「Ａ」、「Ｂ」、「Ｃ」が含まれている）を抽出する。なお、セレクト層２５３０も２値画像である。

図２６は、セレクト層の例を示す説明図である。
文字層処理モジュール２４３０によって、セレクト層２５３０内の文字２５３１、文字２５３２、文字２５３３をアウトライン化する。そして、各文字に文字コードを割り当て、フォントとして登録する。
次に、文字色決定モジュール２４４０が、各文字の色を決定する。図２６の文字２５３２の「Ｂ」の色を決定する場合を例として説明する。
文字２５３２の「Ｂ」の文字を形成している黒画素と同じ位置にある画素を、図２５に示した３個の２値画像（第１層２値画像２５２１、第２層２値画像２５２２、第３層２値画像２５２３）内から抽出する。その抽出した画素が黒である場合（つまり、その文字はその層の２値画像内にあるということ）、その文字の色をその層の２値画像の色に決定する。この場合、文字２５３２の「Ｂ」の文字を形成している黒画素と同じ位置に黒画素があるのは、第２層２値画像２５２２である。第２層２値画像２５２２の色は青であるので、文字２５３２の「Ｂ」の文字の色を青と判断する。ただし、ここでは、一つの画素位置に対して最大１つの層の２値画像のみ対応すると仮定している。

しかし、前述した文字の色の決定方法では、文字の色を１つに決定できない場合がある。つまり、文字内の画素が複数の層の２値画像に対応している場合があるからである。例えば、文字が混色であり、Ｎ層分離モジュール２４１０が分離したときに２つの層になってしまう場合がある。
そこで、以下のように、文字色を決定するようにしてもよい。
（１）文字を形成している黒画素と同じ位置にある画素が全て１つの層の２値画像にある場合（つまり、文字内の色が一つである場合）、（１−１）、（１−２）の処理を行う。
（１−１）その層の２値画像の色を採用する。
（１−２）対応する層の２値画像内の画素からこの画素を消去する。
（２）文字を形成している黒画素と同じ位置にある画素が複数の層の２値画像にある場合（つまり、文字内の色が複数である場合）、（２−１）か（２−２）かを判断する。
（２−１）全ての色が類似している場合、（２−１−１）、（２−１−２）の処理を行う。
（２−１−１）その色の平均値を文字の色として採用する。又は、最も面積の大きな色を採用する。
（２−１−２）対応する層の２値画像内の画素からこの画素を消去する。
（２−２）色が類似していない場合（つまり、色差の大きな色が存在している場合）、（２−２−１）〜（２−２−３）の処理を行う。
（２−２−１）最も面積の大きな色を文字の色として採用する。
（２−２−２）対応する層の２値画像内の画素からこの画素を消去する。
（２−２−３）色差の大きな色の画素は、文字を形成する画素としては採用しない。なお、対応する層の２値画像内の画素からこの画素を消去しない。

このような処理を行うことで、文字の色として採用された画素は、その層の２値画像から消去される。そして、文字の色として採用されていない画素は、その層の２値画像内に残存することとなる。

なお、色が類似しているか否かは、例えば、次のように決定する。
（１）各画素の色の平均色を計算する。
（２）各画素の色と、平均色との色差を計算する。
（３）全ての画素について、前記色差が閾値以下であれば、全ての色が類似していると判断する。

図２７は、出力ファイル形成モジュール２４６０が出力する出力ファイル２７００のデータ構造の例を示す説明図である。
出力ファイル２７００は、バックグラウンド層データ２７９９、第１層から第Ｎ層までの２値画像のデータ（第１層２値画像データ２７０１、第２層２値画像データ２７０２、第Ｎ層２値画像データ２７０Ｎ）、文字層データ２７１０を有している。また、各層の２値画像データは、出力ファイル形成モジュール２４６０によって圧縮し、その圧縮データを出力するようにしてもよい。

文字層データ２７１０は、各文字に色を指定する情報を含んでいる。文字層データ２７１０は、第１−１の実施の形態内の文字層処理モジュール１２１、１２２、１２Ｎで形成される情報に、さらに、各文字に文字色を指定するデータを加えたものである。
例えば、文字層データ２７１０は、図２８に示すような文字層データテーブル２８００を含むものである。つまり、文字層データテーブル２８００は、文字コード欄２８０１、文字サイズ欄２８０２、文字位置Ｘ欄２８０３、文字位置Ｙ欄２８０４、文字色欄２８０５を有している。さらに、この情報に加えて、文字コードと文字形状（アウトラインフォント）との対応が記載されているフォントファイルを有している。

前述の第３−１の実施の形態では、比較する画素の色差の大きな色が存在している場合、最も面積の大きな色を採用しているが、別の方法であってもよい。
例えば、文字を形成する画素を、色差の大きな色が存在している場合に文字として採用しないようにしてもよい。その場合には、その文字の領域を全てバックグラウンド画像に戻す。又は、その画素全てを、その層の２値画像から消去しないようにしてもよい。

また、前述の第３−１の実施の形態では、文字層処理モジュール２４３０による文字層処理を行った後に、文字色決定モジュール２４４０によって文字色を決定するようになっているが、必ずしも、この順序である必要はない。セレクト情報である２値画像に対して、文字の切り出しを行った段階で、文字色を決定すればよい。

また、前述の第３−１の実施の形態では、バックグラウンド画像は、Ｎ層分離モジュール２４１０で生成されているが、各層の２値画像によって消去されない画素があり（つまり、文字色が決定されない場合）、その画素をバックグラウンド画像に戻す処理を行う場合は、バックグラウンド画像の生成は、文字色決定後に行えばよい。

＜第３−２の実施の形態＞
図２９は、第３−２の実施の形態の構成例についての概念的なモジュール構成図である。
第３−１の実施の形態では、Ｎ層の２値画像との対応を基に、各文字の色を決定していったが、第３−２の実施の形態では、入力多値画像との対応を基に、各文字の色を決定していく手法を示す。

第３−２の実施の形態は、セレクト層形成モジュール２９１０、文字矩形分割モジュール２９２０、文字色決定モジュール２９３０、文字層処理モジュール２９４０、多値バックグラウンド層処理モジュール２９５０、出力ファイル形成モジュール２９６０を有している。
セレクト層形成モジュール２９１０は、文字矩形分割モジュール２９２０、多値バックグラウンド層処理モジュール２９５０と接続されており、入力画像から、セレクト情報（２値画像）と、多値のバックグラウンド画像を形成する。この形成方法は、例えば、特許文献２に記載された形成方法を用いればよい。特許文献２に記載された形成方法では、フォアグラウンド画像も形成するが、本実施の形態ではフォアグラウンド画像は形成する必要はない。形成したセレクト情報を文字矩形分割モジュール２９２０へ渡し、バックグラウンド画像を多値バックグラウンド層処理モジュール２９５０へ渡す。

文字矩形分割モジュール２９２０は、セレクト層形成モジュール２９１０、文字色決定モジュール２９３０と接続されており、セレクト層形成モジュール２９１０によって形成されたセレクト情報（２値画像）の黒画素を文字矩形に分割して、ベクトル情報であるアウトラインフォントを生成して、文字色決定モジュール２９３０へ渡す。閉領域のアウトラインフォント毎に文字矩形に分割する。例えば、分割の方法は、第２の実施の形態のアウトライン化モジュール２２２２と同等にしてもよい。
文字色決定モジュール２９３０は、文字矩形分割モジュール２９２０、文字層処理モジュール２９４０と接続されており、文字矩形分割モジュール２９２０から受け取ったアウトラインフォントに対応する入力画像の色に基づいて、そのアウトラインフォントの色情報を決定する。その結果を文字層処理モジュール２９４０へ渡す。

文字層処理モジュール２９４０は、文字色決定モジュール２９３０、出力ファイル形成モジュール２９６０と接続されており、色情報が付加されたアウトラインフォントを文字色決定モジュール２９３０から受け取り、文字層データを生成する。文字層データは、第１の実施の形態又は第２の実施の形態と同等のものである。また、文字層処理モジュール２９４０は、第１の実施の形態における文字層モジュールを含んでいてもよい。
多値バックグラウンド層処理モジュール２９５０は、セレクト層形成モジュール２９１０、出力ファイル形成モジュール２９６０と接続されており、セレクト層形成モジュール２９１０から受け取ったバックグラウンド画像である多値画像を符号化する。その符号化データを出力ファイル形成モジュール２９６０へ渡す。
出力ファイル形成モジュール２９６０は、文字層処理モジュール２９４０、多値バックグラウンド層処理モジュール２９５０と接続されており、多値バックグラウンド層処理モジュール２９５０によって符号化されたバックグラウンド画像の符号化データ、文字層処理モジュール２９４０によって生成されたアウトラインフォント及びそのアウトラインフォントに対応する色情報を有する出力ファイルを形成する。

図３０、３１を用いて、第３−２の実施の形態における処理を説明する。
図３０は、入力カラー画像３０１０、セレクト層３０２０、バックグラウンド画像３０３０の例を示す説明図である。
入力カラー画像３０１０は、セレクト層形成モジュール２９１０によって、セレクト層３０２０、バックグラウンド画像３０３０に分離される。そして、セレクト層３０２０内の各々の文字が、文字矩形分割モジュール２９２０によって分割される。セレクト層３０２０は、２値画像であるため、セレクト層３０２０内の文字「Ａ」、「Ｂ」、「Ｃ」は、色情報をもたない。そこで、文字色決定モジュール２９３０が、各文字毎に文字色を決定していく。
例えば、文字「Ａ」の色を決定する場合、まず、セレクト層３０２０において、「Ａ」の文字を形成する黒画素の位置の画素値を、入力カラー画像３０１０から抽出する。「Ａ」を形成する黒画素は、複数あるため、複数のカラー画素が抽出される。そして、文字色決定モジュール２９３０では、これら複数のカラー画素の平均色を算出して、その平均色を文字色とする。

文字色の決定後、文字層処理モジュール２９４０によって文字層処理が行われる。
そして、出力ファイル形成モジュール２９６０によって、文字層データと、バックグラウンド画像を用いて、出力ファイル３１００が形成される。
図３１は、出力ファイル３１００のデータ構造の例を示す説明図である。
出力ファイル３１００は、バックグラウンド層データ３１０１、文字層データ３１０２を有している。バックグラウンド層データ３１０１、文字層データ３１０２は、第３−１の実施の形態と同等である。

＜第３−２の実施の形態の変形例１＞
第３−２の実施の形態の変形例１は、第３−２の実施の形態の文字色決定モジュール２９３０を、第３−１の実施の形態と同様に、文字内の画素値が類似しているか否かを判断するようにしたものである。つまり、文字内の画素値の色差、色差の分散等を用いて、例えば、分散が閾値よりも大きければ、文字内の画素値が類似していないと判断してもよい。
文字内の画素値が類似していないと判断した場合、文字の黒画素領域の画像をバックグラウンド画像に戻す。そのとき文字の黒画素領域はセレクト情報から消去しておく。
第３−２の実施の形態では、バックグラウンド画像の形成は、セレクト層形成モジュール２９１０によって行われており、文字色決定モジュール２９３０による文字色の決定前に行われているため、このような処理はできない。そこで、第３−２の実施の形態の変形例１では、文字の黒画素領域の画像をバックグラウンド画像に戻すために、文字色決定後のセレクト情報を用いて、バックグラウンド画像を形成する。

図３２は、第３−２の実施の形態の変形例１の構成例についての概念的なモジュール構成図である。
第３−２の実施の形態の変形例１は、セレクト層形成モジュール３２１０、文字矩形分割モジュール３２２０、文字色決定モジュール３２３０、文字層処理モジュール３２４０、バックグラウンド画像形成モジュール３２５０、バックグラウンド層処理モジュール３２６０、出力ファイル形成モジュール３２７０を有している。セレクト層形成モジュール３２１０はセレクト層形成モジュール２９１０に、文字矩形分割モジュール３２２０は文字矩形分割モジュール２９２０に、文字色決定モジュール３２３０は文字色決定モジュール２９３０に、文字層処理モジュール３２４０は文字層処理モジュール２９４０に、バックグラウンド層処理モジュール３２６０は多値バックグラウンド層処理モジュール２９５０に、出力ファイル形成モジュール３２７０は出力ファイル形成モジュール２９６０に該当する。

ただし、セレクト層形成モジュール３２１０は、２値画像であるセレクト情報のみを形成すればよい。
また、文字色決定モジュール３２３０は、前述のように文字色決定モジュール２９３０を文字内の画素値が類似しているか否かを判断するようにしたものであり、類似していると判断した画素（つまり、文字を形成している画素と判断されたもの）をバックグラウンド画像形成モジュール３２５０へ渡す。
バックグラウンド画像形成モジュール３２５０は、文字色決定モジュール３２３０、バックグラウンド層処理モジュール３２６０と接続されており、文字色決定モジュール３２３０から渡された画素を入力画像から消去する。つまり、多値画像であるバックグラウンド画像を形成し、バックグラウンド層処理モジュール３２６０へ渡す。

＜第３−３の実施の形態＞
第３−２の実施の形態（変形例を含む）では、文字の黒画素位置の平均値を、その文字の色情報としたが、セレクト層の形成によっては、文字のエッジが合致していない場合もあるため、色が変色してしまうおそれがある。
そこで、第３−３の実施の形態では、文字の中心付近で文字色を取得する。つまり、第３−３の実施の形態における文字色決定モジュール２９３０（３２３０）を、文字の中心付近の位置で、対応する入力画像の画素の画素値を取得して、その画素値を色情報とする。このためには、文字である画素塊を縮退して、その中の平均値を取得してもよい。縮退の方法は例えば、距離変換して１から順に減らしていくなどの方法がある。距離変換の手法は「南敏他著「画像工学」初版コロナ社９６ページ〜１０３ページ」に記載されている。

＜変形例＞
前述の実施の形態間でモジュールを組み合わせるようにしてもよい。
また、前述の実施の形態では、アウトラインフォントの文字毎に色情報を付加する技術を示したが、アウトラインフォント以外でも同等の処理が可能である。つまり、文字のベクトル化の結果は、アウトラインフォント以外であってもよい。各種描画コマンドを用いて記述するようにしてもよい。例えば、直線を記述する命令、ベジエ曲線を記述する命令、矩形を記述する命令等を利用し、閉領域を記述するようにしてもよい。この閉領域を塗り潰す（フィルする）場合に指定する色情報を、例えば、前述の第１−３−１〜第１−３−３の実施の形態で獲得すればよい。

前述の実施の形態では、文字を形成する画素毎に色を取得していたが、必ずしも文字を形成する画素を特定する必要はない。
例えば、文字を包含する矩形を抽出し、この矩形内の全ての画素に関して、同等の処理を行ってもよい。この手法では、文字を形成する画素を特定しなくてもよいため、処理が簡単になる。

描画命令として、文字の色情報を指定するとき、一つ前の文字と同じ色情報を指定する場合には、必ずしも色情報の指定は必須ではない場合がある。そこで、一つ前の文字と同じ色であれば、色を記述しないとする処理を行うようにしてもよい。そのために、前述の実施の形態に、色を保持するメモリを付加する。色が変化したときに、このメモリに色を保持し、そして、色情報の指定命令を出力すればよい。

前述の実施の形態では、色差の大きな色が存在している場合には、バックグラウンド画像にその文字を戻すことを行うものがある。つまり、いったんは文字を形成する画素を、文字として採用しない場合がある。
この場合には、文字に関して、文字コードを入力しないことになるため、文字認識の結果を付加することができなくなる。
そこで、この場合には、文字に関して、各実施の形態の文字層処理モジュール（又は、それに対応するモジュール）で、透明色の文字コードを含んだ文字層処理を行えばよい。又は、空白のフォント登録を文字コードとして行い、その文字コードを含んだ文字層処理を行えばよい。

前述の実施の形態において、一つの文字内に、色差の大きな画素が存在している場合の処理方法を複数記載したが、他の処理方法もある。
例えば、第３−１の実施の形態に、第２の実施の形態で行ったように、セレクト情報を、フォアグラウンド画像のクリップ情報として用いるようにしてもよい。
図３３は、第３−１の実施の形態の変形例の構成例についての概念的なモジュール構成図である。
第３−１の実施の形態の変形例は、Ｎ層分離モジュール３３１０、セレクト層形成モジュール３３２０、文字矩形分割モジュール３３３０、文字色決定モジュール３３４０、文字層処理モジュール３３５０、フォアグラウンド画像形成モジュール３３６０、多値バックグラウンド層処理モジュール３３７０、出力ファイル形成モジュール３３８０を有している。Ｎ層分離モジュール３３１０はＮ層分離モジュール２４１０に、セレクト層形成モジュール３３２０はセレクト層形成モジュール２４２０に、文字色決定モジュール３３４０は文字色決定モジュール２４４０に、多値バックグラウンド層処理モジュール３３７０は多値バックグラウンド層処理モジュール２４５０に、出力ファイル形成モジュール３３８０は出力ファイル形成モジュール２４６０に該当する。
文字矩形分割モジュール３３３０は、セレクト層形成モジュール３３２０、文字色決定モジュール３３４０と接続されている。第３−２の実施の形態の文字矩形分割モジュール２９２０と同等のものである。

文字色決定モジュール３３４０は、Ｎ層分離モジュール３３１０、文字矩形分割モジュール３３３０、文字層処理モジュール３３５０、フォアグラウンド画像形成モジュール３３６０、出力ファイル形成モジュール３３８０と接続されている。文字矩形分割モジュール３３３０によって分割された文字矩形毎に色情報を付加する。そして、フォアグラウンド画像形成モジュール３３６０へクリップ情報として、クリップする位置を示す２値画像を渡す。
また、文字色決定モジュール３３４０は、文字矩形内の画素間の色差が大きい場合、その画素位置をクリップすると判断する。
文字層処理モジュール３３５０は、文字色決定モジュール３３４０、出力ファイル形成モジュール３３８０と接続されており、第１の実施の形態における文字層処理モジュールと同等である。

フォアグラウンド画像形成モジュール３３６０は、文字色決定モジュール３３４０、出力ファイル形成モジュール３３８０と接続されている。クリップする位置を示す２値画像を文字色決定モジュール３３４０から取得する。この２値画像と、入力画像を用いて、フォアグラウンド画像を形成する。フォアグラウンド画像の形成方法は、特許文献２に記載した技術と同等である。
フォアグラウンド画像形成モジュール３３６０は、文字色決定モジュール３３４０から渡されたクリップ情報を用いて、そのクリップする画素位置を残すように、入力画像からフォアグラウンド画像を形成してもよい。この形成の方法は、特許文献２におけるセレクタ情報をクリップ画素位置に変更して、フォアグラウンド画像を形成する処理と同等である。
また、フォアグラウンド画像形成モジュール３３６０は、フォアグラウンド画像を圧縮してもよい。

また、例えば、第３−２の実施の形態に、第２の実施の形態で行ったように、セレクト情報を、フォアグラウンド画像のクリップ情報として用いるようにしてもよい。
図３４は、第３−２の実施の形態の変形例２の構成例についての概念的なモジュール構成図である。
第３−２の実施の形態の変形例２は、セレクト層形成モジュール３４１０、文字矩形分割モジュール３４２０、文字色決定モジュール３４３０、文字層処理モジュール３４４０、フォアグラウンド画像形成モジュール３４５０、多値バックグラウンド層処理モジュール３４６０、出力ファイル形成モジュール３４７０を有している。セレクト層形成モジュール３４１０はセレクト層形成モジュール２９１０に、文字矩形分割モジュール３４２０は文字矩形分割モジュール２９２０に、文字色決定モジュール３４３０は文字色決定モジュール２９３０に、文字層処理モジュール３４４０は文字層処理モジュール２９４０に、多値バックグラウンド層処理モジュール３４６０は多値バックグラウンド層処理モジュール２９５０に、出力ファイル形成モジュール３４７０は出力ファイル形成モジュール２９６０に該当する。

文字色決定モジュール３４３０は、文字矩形分割モジュール３４２０、フォアグラウンド画像形成モジュール３４５０、文字層処理モジュール３４４０と接続されている。文字色決定モジュール３４３０は、文字矩形分割モジュール３４２０によって分割された文字矩形毎に色情報を付加する。そして、フォアグラウンド画像形成モジュール３４５０へクリップ情報として、クリップする位置を示す２値画像を渡す。
また、文字色決定モジュール３４３０は、文字矩形内の画素間の色差が大きい場合、その画素位置をクリップすると判断する。
フォアグラウンド画像形成モジュール３４５０は、文字色決定モジュール３４３０、出力ファイル形成モジュール３４７０と接続されている。クリップする位置を示す２値画像を文字色決定モジュール３４３０から取得する。この２値画像と、入力画像を用いて、フォアグラウンド画像を形成する。フォアグラウンド画像の形成方法は、特許文献２に記載した技術と同等である。

第３−１の実施の形態の変形例の出力ファイル形成モジュール３３８０、第３−２の実施の形態の変形例２の出力ファイル形成モジュール３４７０によって出力ファイル（出力ファイル３５００又は出力ファイル３６００等）を出力する。
図３５は、出力ファイル３５００のデータ構造の例を示す説明図であり、出力ファイル３５００は、バックグラウンド層データ３５０１、文字層データ３５０２、フォアグラウンド層データ３５０３を有している。
図３６は、出力ファイル３６００のデータ構造の例を示す説明図であり、出力ファイル３６００は、バックグラウンド層データ３６９９、第１層２値画像データ３６０１、第２層２値画像データ３６０２、第Ｎ層２値画像データ３６０Ｎ、文字層データ３６１０、フォアグラウンド層データ３６２０を有している。

さらに、文字層データテーブル３７００として、文字色に加えて、その文字をフォアグラウンド画像でクリップした文字色にするか否かの情報も含めるようにしてもよい。具体的には、図３７に示すようなデータ構造の例であってもよい。文字層データテーブル３７００は、文字コード欄３７０１、文字サイズ欄３７０２、文字位置Ｘ欄３７０３、文字位置Ｙ欄３７０４、文字色欄３７０５、クリップするか否か欄３７０６を有している。

さらに、出力ファイルとして、クリップの場合の文字層データは、第２の実施の形態による出力ファイル２３００と同等のものであってもよい。つまり、出力ファイル２３００は、バックグラウンド画像データ２３０１、フォアグラウンド画像データ２３０２、アウトラインデータ２３０３、描画記述２３０４を有している。
そして、描画記述２３０４には、以下に示す各情報（（１）〜（３））を記述する。
（１）バックグラウンド画像の描画命令
（２）セレクト情報であるアウトラインデータを用いて、フォアグラウンド画像をクリップする命令
（３）クリップ後のフォアグラウンド画像をバックグラウンド画像の上に上書きする命令
このうち、バックグラウンド画像の描画命令は、クリップをしない場合と同じであるため、クリップの場合も特別な命令は必要ない。文字（又は描画命令で記述された閉領域）をクリップする場合には、色情報ではなく、クリップ命令を記載する。さらに、クリップを行う先のフォアグラウンド画像を記述する。

図３８を参照して、前述の実施の形態のハードウェア構成例について説明する。図３８に示す構成は、例えばパーソナルコンピュータ（ＰＣ）などによって構成される画像処理システムであり、スキャナ等のデータ読み取り部３８１７と、プリンタなどのデータ出力部３８１８を備えたハードウェア構成例を示している。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３８０１は、前述の実施の形態において説明した各種のモジュール、すなわち、Ｎ層分離モジュール１１０、文字層処理モジュール１２１、出力ファイル形成モジュール１３０、フォント登録モジュール４３０、出力ファイル形成モジュール４４０、代表文字決定モジュール６２０、拡大モジュール８４０、統一フォント処理モジュール１４４０、３層分離モジュール２２１０、セレクト層形成モジュール２４２０、多値バックグラウンド層処理モジュール２４５０等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）３８０２は、ＣＰＵ３８０１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）３８０３は、ＣＰＵ３８０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバスなどから構成されるホストバス３８０４により相互に接続されている。

ホストバス３８０４は、ブリッジ３８０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス３８０６に接続されている。

キーボード３８０８、マウス等のポインティングデバイス３８０９は、操作者により操作される入力デバイスである。ディスプレイ３８１０は、液晶表示装置又はＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）などからなり、各種情報をテキストやイメージ情報として表示する。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）３８１１は、ハードディスクを内蔵し、ハードディスクを駆動し、ＣＰＵ３８０１によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、入力された画像データ、出力ファイル、各モジュールの処理結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。

ドライブ３８１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体３８１３に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース３８０７、外部バス３８０６、ブリッジ３８０５、及びホストバス３８０４を介して接続されているＲＡＭ３８０３に供給する。リムーバブル記録媒体３８１３も、ハードディスクと同等のデータ記録領域として利用可能である。

接続ポート３８１４は、外部接続機器３８１５を接続するポートであり、ＵＳＢ、ＩＥＥＥ１３９４等の接続部をもつ。接続ポート３８１４は、インタフェース３８０７、及び外部バス３８０６、ブリッジ３８０５、ホストバス３８０４等を介してＣＰＵ３８０１等に接続されている。通信部３８１６は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部３８１７は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部３８１８は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

なお、図３８に示すハードウェア構成は、１つの構成例を示すものであり、前述の実施の形態は、図３８に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア（例えば特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）等）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図３８に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機（スキャナ、プリンタ、複写機、ファックス等のいずれか２つ以上の機能を有している画像処理装置）などに組み込まれていてもよい。

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。

第１−１の実施の形態の構成例についての概念的なモジュール構成図である。第１−１の実施の形態による処理例を示すフローチャートである。出力ファイルのデータ構造の例を示す説明図である。第１−１−１の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−１の実施の形態による処理例を示すフローチャートである。第１−１−２の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−２の実施の形態による処理例を示すフローチャートである。第１−１−３の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−３の実施の形態による処理例を示す説明図である。拡大モジュールによる高解像度文字画像データの生成処理例を示す説明図である。第１−１−３の実施の形態による処理例を示すフローチャートである。第１−１−４の実施の形態の構成例についての概念的なモジュール構成図である。第１−１−４の実施の形態による処理例を示すフローチャートである。第１−２の実施の形態の構成例についての概念的なモジュール構成図である。第１−３の実施の形態内の文字層処理モジュールの構成例についての概念的なモジュール構成図である。文字切り出しモジュール内の構成例についての概念的なモジュール構成図である。文字層出力モジュール内の構成例についての概念的なモジュール構成図である。出力ファイルのデータ構造の例を示す説明図である。文字層データと２値画像層データの例を示す説明図である。第１−３の実施の形態の変形例における文字切り出しモジュール内の構成例についての概念的なモジュール構成図である。第１−３の実施の形態における出力ファイルのデータ構造の例を示す説明図である。第２の実施の形態の構成例についての概念的なモジュール構成図である。出力ファイルのデータ構造の例を示す説明図である。第３−１の実施の形態の構成例についての概念的なモジュール構成図である。Ｎ層分離画像とセレクト層の例を示す説明図である。セレクト層の例を示す説明図である。出力ファイルのデータ構造の例を示す説明図である。文字層データテーブルのデータ構造の例を示す説明図である。第３−２の実施の形態の構成例についての概念的なモジュール構成図である。入力カラー画像、セレクト層、バックグラウンド画像の例を示す説明図である。出力ファイルのデータ構造の例を示す説明図である。第３−２の実施の形態の変形例１の構成例についての概念的なモジュール構成図である。第３−１の実施の形態の変形例の構成例についての概念的なモジュール構成図である。第３−２の実施の形態の変形例２の構成例についての概念的なモジュール構成図である。出力ファイルのデータ構造の例を示す説明図である。出力ファイルのデータ構造の例を示す説明図である。文字層データテーブルのデータ構造の例を示す説明図である。第１〜第３の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。

符号の説明

１１０…Ｎ層分離モジュール
１２１、１２２、１２Ｎ…文字層処理モジュール
１２９…多値バックグラウンド層処理モジュール
１３０…出力ファイル形成モジュール
４１０…文字切り出しモジュール
４２０…文字コード決定モジュール
４３０…フォント登録モジュール
４４０…出力ファイル形成モジュール
６１０…文字切り出しモジュール
６２０…代表文字決定モジュール
６３０…文字コード決定モジュール
６４０…フォント登録モジュール
６５０…出力ファイル形成モジュール
８１０…文字切り出しモジュール
８２０…代表文字決定モジュール
８３０…文字コード決定モジュール
８４０…拡大モジュール
８５０…フォント登録モジュール
８６０…出力ファイル形成モジュール
１２１０…文字切り出しモジュール
１２２０…代表文字決定モジュール
１２３０…拡大モジュール
１２４０…文字コード決定モジュール
１２５０…フォント登録モジュール
１２６０…出力ファイル形成モジュール
１４１０…Ｎ層分離モジュール
１４２１、１４２２、１４２Ｎ…文字層処理モジュール
１４２９…多値バックグラウンド層処理モジュール
１４３０…出力ファイル形成モジュール
１４４０…統一フォント処理モジュール
１５０１…文字切り出しモジュール
１５０２…文字層出力モジュール
１５０３…２値画像層出力モジュール
１５０４…出力ファイル形成モジュール
１６０１…画素塊抽出モジュール
１６０２…画素塊サイズ検証モジュール
１６０３…画素塊消去モジュール
１７０１…フォント登録モジュール
１７０２…文字コード決定モジュール
１７０３…文字層形成モジュール
２００１…文字切り出しモジュール
２００２…画素塊サイズ検証モジュール
２００３…画素塊復活モジュール
２２１０…３層分離モジュール
２２２１…多値画像（フォアグラウンド）処理モジュール
２２２２…アウトライン化モジュール
２２２３…多値画像（バックグラウンド）処理モジュール
２２３０…出力ファイル形成モジュール
２４１０…Ｎ層分離モジュール
２４２０…セレクト層形成モジュール
２４３０…文字層処理モジュール
２４４０…文字色決定モジュール
２４５０…多値バックグラウンド層処理モジュール
２４６０…出力ファイル形成モジュール
２９１０…セレクト層形成モジュール
２９２０…文字矩形分割モジュール
２９３０…文字色決定モジュール
２９４０…文字層処理モジュール
２９５０…多値バックグラウンド層処理モジュール
２９６０…出力ファイル形成モジュール
３２１０…セレクト層形成モジュール
３２２０…文字矩形分割モジュール
３２３０…文字色決定モジュール
３２４０…文字層処理モジュール
３２５０…バックグラウンド画像形成モジュール
３２６０…バックグラウンド層処理モジュール
３２７０…出力ファイル形成モジュール
３３１０…Ｎ層分離モジュール
３３２０…セレクト層形成モジュール
３３３０…文字矩形分割モジュール
３３４０…文字色決定モジュール
３３５０…文字層処理モジュール
３３６０…フォアグラウンド画像形成モジュール
３３７０…多値バックグラウンド層処理モジュール
３３８０…出力ファイル形成モジュール
３４１０…セレクト層形成モジュール
３４２０…文字矩形分割モジュール
３４３０…文字色決定モジュール
３４４０…文字層処理モジュール
３４５０…フォアグラウンド画像形成モジュール
３４６０…多値バックグラウンド層処理モジュール
３４７０…出力ファイル形成モジュール

Claims

多値画像から前景の多値画像、背景の多値画像及び該前景の多値画像を切り抜くための選択情報である２値画像を抽出する画像抽出手段と、
前記画像抽出手段によって抽出された２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記画像抽出手段によって抽出された前景の多値画像、前記画像抽出手段によって抽出された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成するファイル形成手段
を具備し、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記ベクトル情報で切り抜かれる前記前景の多値画像は、アウトライン化された文字を含む領域内を該文字の色で塗り潰したものとする
ことを特徴とする画像処理装置。
前記画像処理装置は、
前記画像抽出手段によって抽出された前景の多値画像を符号化する第１の符号化手段と、
前記画像抽出手段によって抽出された背景の多値画像を符号化する第２の符号化手段
を具備し、
前記ファイル形成手段は、前記第１の符号化手段によって符号化された前景の多値画像、前記第２の符号化手段によって符号化された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成する
ことを特徴とする請求項１に記載の画像処理装置。
多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、
前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記画像抽出手段によって抽出された２値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、
前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、
前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段
を具備し、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記色決定手段は、文字内の前記２値画像の色が一つである場合、文字内の前記２値画像の色が複数であってその色が類似している場合、文字内の前記２値画像の色が複数であってその色が類似していない場合に分けて処理を行う
ことを特徴とする画像処理装置。
多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、
前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記多値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、
前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、
前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段
を具備し、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記色決定手段は、前記多値画像内の文字内の平均色をベクトル情報の色情報とする、前記多値画像内の文字内の画素値が類似している場合と類似していない場合に分けてベクトル情報の色情報を決定する、又は前記多値画像内の文字の中心付近の色でベクトル情報の色情報を決定する
ことを特徴とする画像処理装置。
前記色決定手段は、前記ベクトル情報に対応する２値画像が複数ある場合、該２値画像の色の平均値又は色の占める面積に基づいて、該ベクトル情報の色を決定する
ことを特徴とする請求項３又は４に記載の画像処理装置。
コンピュータを、
多値画像から前景の多値画像、背景の多値画像及び該前景の多値画像を切り抜くための選択情報である２値画像を抽出する画像抽出手段と、
前記画像抽出手段によって抽出された２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記画像抽出手段によって抽出された前景の多値画像、前記画像抽出手段によって抽出された背景の多値画像、前記ベクトル情報生成手段によって生成されたベクトル情報、該背景の多値画像の描画命令記述、該ベクトル情報で該前景の多値画像を切り抜く切り抜き描画記述及び該切り抜き描画記述によって切り抜かれた画像を該背景の多値画像に描画する切り抜き画像描画記述を有するファイルを形成するファイル形成手段
として機能させ、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記ベクトル情報で切り抜かれる前記前景の多値画像は、アウトライン化された文字を含む領域内を該文字の色で塗り潰したものとする
ことを特徴とする画像処理プログラム。
コンピュータを、
多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、
前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記画像抽出手段によって抽出された２値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、
前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、
前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段
として機能させ、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記色決定手段は、文字内の前記２値画像の色が一つである場合、文字内の前記２値画像の色が複数であってその色が類似している場合、文字内の前記２値画像の色が複数であってその色が類似していない場合に分けて処理を行う
ことを特徴とする画像処理プログラム。
コンピュータを、
多値画像から前景の画像を切り抜くための選択情報である色ごとの２値画像を抽出する画像抽出手段と、
前記多値画像内の前記前景の２値画像の輪郭を閉領域化するベクトル化を行って、ベクトル情報を生成するベクトル情報生成手段と、
前記ベクトル情報生成手段によって生成されたベクトル情報に対応する前記多値画像の色に基づいて、該ベクトル情報の色情報を決定する色決定手段と、
前記多値画像内の背景の多値画像を符号化する背景画像符号化手段と、
前記背景画像符号化手段によって符号化された背景の多値画像の符号化データ、前記ベクトル情報生成手段によって生成されたベクトル情報及び該ベクトル情報に対応する前記色決定手段によって決定された色情報を有するファイルを形成するファイル形成手段
として機能させ、
前記ベクトル情報生成手段が生成するベクトル情報は、アウトライン化された文字の形状を表しており、
前記色決定手段は、前記多値画像内の文字内の平均色をベクトル情報の色情報とする、前記多値画像内の文字内の画素値が類似している場合と類似していない場合に分けてベクトル情報の色情報を決定する、又は前記多値画像内の文字の中心付近の色でベクトル情報の色情報を決定する
ことを特徴とする画像処理プログラム。