JP2008199249A

JP2008199249A - 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム

Info

Publication number: JP2008199249A
Application number: JP2007031600A
Authority: JP
Inventors: Shunichi Kimura; 俊一木村; Masanori Sekino; 雅則関野; Yutaka Koshi; 裕越
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2007-02-13
Filing date: 2007-02-13
Publication date: 2008-08-28

Abstract

【課題】画像を圧縮する場合に、フォント画像との対応をとるための処理負荷を少なくすることができるようにした画像処理装置を提供する。
【解決手段】画像処理装置の領域抽出手段は入力画像から同等の形状である領域を抽出し、代表形状生成手段は前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成し、フォント画像生成手段はフォントの画像を生成し、比較手段は前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する。
【選択図】図１

Description

本発明は、画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラムに関する。

複写機等の画像処理装置では、画像圧縮技術が用いられている。例えば、文字を主とした画像に適したＭＭＲ（ＭｏｄｉｆｉｅｄＭｏｄｉｆｉｅｄＲＥＡＤ）やＪＢＩＧ（ＪｏｉｎｔＢｉ−ｌｅｖｅｌＩｍａｇｅＧｒｏｕｐ）などがある。
しかしながら、より高効率の圧縮率が求められており、ＭＭＲやＪＢＩＧなどのような画像圧縮方式での圧縮率では、その要望に応えられていない。
そこで、文字画像を文字コードに変換して圧縮する方式が提案されている。これに関連する技術として、例えば、特許文献１には、画像データ中の文字画像データを文字フォントと比較し、文字フォントに置換し、画像データと文字画像データをそれぞれ分離して圧縮することにより、画像データの圧縮率の向上、画質の向上を図ることを目的として、画像データの入力部と、文字画像データの有無を判断する文字画像認識部と、画像データと文字画像データとを分離する文字画像分離部と、文字画像データを圧縮する文字列圧縮部と、画像データを圧縮する画像圧縮部と、圧縮された文字画像データと画像データとを１つのデータにする合成部と、以上の動作を制御する制御部と、合成部で１つにまとめられたデータを再び文字画像データと画像データに分割する分割部と、文字画像データを伸長する文字列伸長部と、画像データを伸長する画像伸長部と、伸長された文字画像データと画像データとを表示する表示部とを有し、画像データ中から文字画像データを文字フォントとして分離して圧縮し、文字フォントで文字を表示することが記載されている。
また、例えば、特許文献２には、文字部分の符号化情報量を大幅に削減し、画像の圧縮率を飛躍的に向上させることを課題とし、まず、入力画像に対して文字領域抽出部において文字領域が抽出され、文字領域の画素値は文字認識部において文字部分がベクトル化され、文字として認識され、その結果、文字コードが出力され、文字コードに対応する各種フォントがフォントデータベースから検索され、それらが文字領域の画像と共に文字マッチング部に入力され、文字マッチング部では、文字領域の画素に最もよく近似するフォントの種類、文字のサイズ、文字の色が探索される。これらのデータと共に、文字部分の開始位置、文字間隔、文字コードが符号化データとして出力されることが記載されている。つまり、特許文献２に開示の技術は、入力画像中の文字領域を抽出し、文字認識を行い、文字コード化し、その文字コードに対応する各種文字フォントのうち、前記文字領域に最も近いフォントを探索し、そのパラメーターを符号化するものである。そして、復号時には、同一フォントデータベースを利用して、文字画像生成を行うものである。
また、非特許文献１には、ＪＢＩＧ２についてが開示されている。
また、非特許文献２には、文字の抽出方法に関する技術が開示されている。
特開平０５−３２８１４７号公報特開平１０−１７８６３８号公報 ISO/IEC JTC 1 / SC 29 /WG 1 N1359 I. H. Witten, A. Moffat, andT. C. Bell 著「Managing Gigabytes」 Morgan Kaufmmann Publishers pp. 320-332.

本発明は、画像を圧縮する場合に、フォント画像との対応をとるための処理負荷を少なくすることができるようにした画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラムを提供することを目的としている。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
［１］入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
を具備することを特徴とする画像処理装置。

［２］さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする［１］に記載の画像処理装置。

［３］入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
を具備することを特徴とする画像符号化装置。

［４］さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする［３］に記載の画像符号化装置。

［５］前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする［３］又は［４］に記載の画像符号化装置。

［６］前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする［３］又は［４］に記載の画像符号化装置。

［７］さらに、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
を具備することを特徴とする［４］に記載の画像符号化装置。

［８］コンピュータを、
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
として機能させることを特徴とする画像処理プログラム。

［９］さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする［８］に記載の画像処理プログラム。

［１０］入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
として機能させることを特徴とする画像符号化プログラム。

［１１］さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする［１０］に記載の画像符号化プログラム。

［１２］前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする［１０］又は［１１］に記載の画像符号化プログラム。

［１３］前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする［１０］又は［１１］に記載の画像符号化プログラム。

［１４］さらに、前記コンピュータを、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
として機能させることを特徴とする［１１］に記載の画像符号化プログラム。

請求項１に記載の画像処理装置によれば、画像を圧縮する場合に、本構成を有していない場合に比較して、フォント画像との対応をとるための処理負荷を少なくすることができる。

請求項２に記載の画像処理装置によれば、請求項１に記載の画像処理装置による効果に加えて、フォント画像との対応をとるための処理負荷をより一層少なくすることができる。

請求項３に記載の画像符号化装置によれば、画像を圧縮する場合に、本構成を有していない場合に比較して、フォント画像との対応をとるための処理負荷を少なくし、圧縮率を向上させることができる。

請求項４に記載の画像符号化装置によれば、請求項３に記載の画像符号化装置による効果に加えて、フォント画像との対応をとるための処理負荷をより一層少なくすることができる。

請求項５及び６に記載の画像符号化装置によれば、請求項３又は４に記載の画像符号化装置による効果に加えて、フォント画像の圧縮率をより向上させることができる。

請求項７に記載の画像符号化装置によれば、請求項４に記載の画像符号化装置による効果に加えて、画像の圧縮率を向上させることができる。

請求項８に記載の画像処理プログラムによれば、画像を圧縮する場合に、本構成を有していない場合に比較して、フォント画像との対応をとるための処理負荷を少なくすることができる。

請求項９に記載の画像処理プログラムによれば、請求項８に記載の画像処理プログラムによる効果に加えて、フォント画像との対応をとるための処理負荷をより一層少なくすることができる。

請求項１０に記載の画像符号化プログラムによれば、画像を圧縮する場合に、本構成を有していない場合に比較して、フォント画像との対応をとるための処理負荷を少なくし、圧縮率を向上させることができる。

請求項１１に記載の画像符号化プログラムによれば、請求項１０に記載の画像符号化プログラムによる効果に加えて、フォント画像との対応をとるための処理負荷をより一層少なくすることができる。

請求項１２及び１３に記載の画像符号化プログラムによれば、請求項１０又は１１に記載の画像符号化プログラムによる効果に加えて、フォント画像の圧縮率をより向上させることができる。

請求項１４に記載の画像符号化プログラムによれば、請求項１１に記載の画像符号化プログラムによる効果に加えて、画像の圧縮率を向上させることができる。

まず、本実施の形態の理解を容易にするために、基本的な考え方を説明する。
特許文献２のような従来の手法では、入力画像に対して、文字認識、及び、フォント画像との比較を、以下の回数行う必要がある。
文字数×フォントサイズ×フォント種×（その他、ボールド、イタリックなどの強調の種類等）
となる。上記のように、各文字に対して比較を行わなければならないため、比較の回数が膨大である。

さらに、前記の従来の手法を実施した場合は、以下のような状況である。
文字コードで符号化を行うため、符号化器と復号器で同一のフォントデータベースを持つ必要がある。そのため、符号化器と復号器でフォントデータベースを同一とするためのコストが大きい。例えば、符号化器側でフォントデータを変更する場合には、変更後のフォントデータを復号器に伝送する必要がある。
あるいは、符号化器と復号器で異なるフォントデータベースを持ってもよいが、その場合には符号化器側で想定した画像と異なる画像が復号器で生成されてしまうことがある。
さらに、復号器で必要とするフォント画像のデータ量は、符号化された文字コード分だけでよいはずであるのにも関わらず、全てのフォント画像のデータを復号器で有していなければならない。すなわち、復号器のフォントデータベースの大半が無駄となってしまっている。

さらに、文字毎にフォント画像との対応をとっている。そのため、入力画像中に存在する元々は同一フォントの文字が、異なるフォントに変換されてしまい、画像品質が劣化する場合がある。これに関して、図１４を用いて解説する。図１４は画像間の近似度を計測できる空間であるとする。すなわち、図１４内の点が近い画像がより似ていると判断できる空間である。今、入力文字画像Ｎ１及び入力文字画像Ｎ２をフォント画像と比較するとする。フォント画像としては、フォント画像Ｆ１とフォント画像Ｆ２があるとする。また、入力文字画像Ｎ１と入力文字画像Ｎ２は元々同一フォントで、非常に似ている画像であるとする。
従来例では、入力文字画像Ｎ１に対して、フォント画像Ｆ１とフォント画像Ｆ２との対応をとって、近い方を選択する。図１４では、入力文字画像Ｎ１に最も近いフォント画像はフォント画像Ｆ１であるため、入力文字画像Ｎ１に対してはフォント画像Ｆ１が選択される。同様に、入力文字画像Ｎ２に最も近いフォント画像はフォント画像Ｆ２であるため、入力文字画像Ｎ２に対してはフォント画像Ｆ２が選択される。このような場合、非常に似ているはずの入力文字画像Ｎ１と入力文字画像Ｎ２が全く異なるフォントに変換される危険性があり、圧縮文字品質が著しく損なわれるという問題点がある。

以上示した、従来例の状況を以下に列挙する。
（１）各文字に対して文字認識、及び、フォント画像との対応をとる処理負荷が大きい。
（２）符号化器と復号器でフォントデータベースを共通化させるコストが大きい。また、復号器が持つフォントデータベース内の大半が無用なものとなっている。
（３）同一フォントであるべき画像が別フォントとなってしまい、画質劣化となる。

本実施の形態を説明する前に、ＪＢＩＧ２の説明を行う。ＪＢＩＧ２の内容は、非特許文献１に述べられている。ＪＢＩＧ２にはテキストリージョン符号化方式と呼ばれる方式がある。
以下、ＪＢＩＧ２のテキストリージョン符号化方式の概要を示す。
（１）まず、入力画像の中から、同一文字とみなせる領域を抽出する。
例えば、入力画像中にあるフォント、あるサイズの文字「ａ」が複数存在するとする。この文字「ａ」の複数の領域（つまり、「ａ」という文字が出現している画像領域）を抽出する。この複数の領域中の文字「ａ」はほぼ同じ形状を持つものである。
文字の抽出方法としては、例えば、非特許文献２にその方法が記載されている。連結する画素を抜き出し、抜き出した連結成分のテンプレートマッチングを行う方法である。
（２）上記の同一文字とみなせる領域を用いて、代表文字形状を作成する。
（３）代表文字形状に番号（以下、文字番号とする）を付与する。
（４）各文字の文字番号と、文字の位置と、代表文字形状を符号化する。
上記のＪＢＩＧ２のテキストリージョン符号化方式によって符号化されたものを復号する場合には、文字番号と、代表文字形状と、文字の位置を用いて各文字を復元する。

本実施の形態の概略を述べる。
符号化の処理について述べる。
（１）まず、入力画像の中から、同一文字とみなせる領域を抽出する。これはＪＢＩＧ２のテキストリージョン符号化時に用いられるものと同等の処理を行えばよい。
（２）上記の同一文字とみなせる領域を用いて、代表文字形状を作成する。これも、ＪＢＩＧ２のテキストリージョン符号化時に用いられるものと同等の処理を行えばよい。
（３）代表文字形状に番号（以下、文字番号とする）を付与する。
（４）上記代表文字形状に対して、文字認識を行う。
（５）上記認識結果と、フォントデータベースを用いて、代表文字形状と最も似通ったフォントを選択する。
（６）代表文字形状を、上記最も似通ったフォント画像に入れ替える。
（７）各文字の文字番号と、文字の位置と、代表文字形状（フォント画像）を符号化する。

次に復号の処理については、復号器はＪＢＩＧ２の復号器と同様となる。つまり、代表文字形状を復元し、文字番号で指定される代表文字形状を取り出し、文字位置を用いて出力画像内にその文字を貼り付ければよい。

上記で示した実施の形態によって、以下のような効果を得ることができる。
（１）文字認識や、フォント画像とのマッチングは、代表文字形状に対してのみ行えばよいため、処理負荷が格段に減少する。
（２）最初に同一文字領域の抽出を行うため、似通った文字は同じフォントの画像とすることができる。
（３）フォント画像で作成した代表文字形状を符号化するため、復号器にフォントデータベースが不要である。そのため、
（３−１）符号化器でフォントデータベースを変更しても、復号器にそれを反映させる必要が無い。
（３−２）復号器で、フォントデータベースを有する必要が無い。
（３−３）ＪＢＩＧ２の復号器で復号可能なように符号を形成することが可能となる。
ただし、上記に示す効果は、特許請求の範囲に記載した発明全体にわたる効果ではないことに注意されたい。特許請求の範囲に記載した発明としては、上記で示した概要のサブセットとなるものもあるため、必ずしも全ての効果を有するものではない。なお、このただし書きは、例えば、復号器にフォントデータベースを有している形態も、本発明に含まれる態様であるために、記載している。
上記では、ＪＢＩＧ２を例として示したが、ＪＢＩＧ２符号化を行う必要は全く無い。ただし、ＪＢＩＧ２符号ストリーム化することによって、標準ＪＢＩＧ２復号器を用いて画像を生成できるというメリットがある。

以下、図面に基づき本発明の好適な各種の実施の形態をさらに具体的に説明する。
図１〜図４は、第１の実施の形態を説明する図面である。図１、図２は、第１の実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システム及び方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（データの授受、指示等）を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
以下、ＪＢＩＧ２の符号を生成する場合を用いて説明する。

第１の実施の形態である符号化装置は、図１に示すように、同一文字領域抽出モジュール１１、文字番号、文字位置符号化モジュール１２、代表文字形状生成モジュール１３、文字認識モジュール１４、フォントデータベース１５、文字マッチングモジュール１６、代表文字形状符号化モジュール１７を有している。

同一文字領域抽出モジュール１１は、図１に示すように、文字番号、文字位置符号化モジュール１２、代表文字形状生成モジュール１３と接続されており、入力画像から同等の形状である領域を抽出する。つまり、入力画像から、同等の文字と認められる領域を抽出する。ここで、同じ文字として抽出された領域に同一の番号（文字番号）を付与する。なお、抽出する具体的な処理としては、例えば、黒画素塊を１つの文字として抽出し、その黒画素塊間でマッチング処理を行って、相違する画素数がある閾値以下であるものを同等の形状であると判断するようにしている。

文字番号、文字位置符号化モジュール１２は、図１に示すように、同一文字領域抽出モジュール１１と接続されており、上記文字番号と、その文字の位置を符号化する。
代表文字形状生成モジュール１３は、図１に示すように、同一文字領域抽出モジュール１１、文字認識モジュール１４、文字マッチングモジュール１６と接続されており、同一文字領域抽出モジュール１１によって抽出された同等の形状である領域に基づいて、その領域を代表する形状である代表文字形状を生成し、その代表文字形状の画像データを文字認識モジュール１４と文字マッチングモジュール１６へ渡す。
すなわち、同じ文字と認められた（一つあるいは複数の）領域を用いて、一つの代表文字形状を生成する。例えば、同じ文字と考えられる複数の領域の文字の重心を合わせた後、その平均値を用いて代表文字形状を生成するなどすればよい。また、同一文字領域抽出モジュール１１によって抽出した領域の一つを選択するようにしてもよい。ここで生成された代表文字形状には、その形状と文字番号をリンクさせておく。つまり、文字番号を用いて代表文字形状の画像データを検索可能としておく。
さらに、代表文字形状生成モジュール１３による代表文字形状生成方法としては、特開２００５−３０１６６３号公報に開示されている方法を用いることもできる。又は、代表文字形状生成方法としては、同一文字コードとなった画像の中から一つを選択するだけでもよい。選択方法としては、ランダムに選んでもよいし、最初に出現した画像を選んでもよいし、あるいは、他の画像との距離が最も小さくなるような画像を選んでもよい。ここで、距離とは、例えば、画像を２値として、画像のＸＯＲ（排他的論理和）をとった時の総和を用いることができる。

文字認識モジュール１４は、図１に示すように、代表文字形状生成モジュール１３、フォントデータベース１５と接続されており、代表文字形状生成モジュール１３によって生成された代表文字形状の画像データのそれぞれを文字として認識する。その文字コードをフォントデータベース１５へ渡す。
フォントデータベース１５は、図１に示すように、文字認識モジュール１４、文字マッチングモジュール１６と接続されており、文字コードに対応する各種フォントが格納されている。そして、文字認識モジュール１４による認識結果である文字コードに基づいて、その文字コードに対応する複数のフォント画像を文字マッチングモジュール１６に出力する。例えば、フォントデータベース１５に明朝体とゴシック体が蓄えられているとすると、認識結果である文字コードに対応した明朝体とゴシック体のフォント画像が文字マッチングモジュール１６に渡される。
なお、複数のフォント画像は、文字認識モジュール１４による文字認識で得られた文字コードに対して、複数のフォント種、複数のサイズ（ポイント）、複数の強調（イタリック、ボールドなど）、複数のスキュー角（傾き）、複数の解像度で作成されている。複数の解像度のフォント画像は、文字のポイント数と、画素の大きさとの相対的な大きさを変えて文字を描画することによって得ることができる。これは、同じ文字であっても、相対的に画素が大きな時には、違った文字形状が描画されるため、これに対応できるようにするためである。

文字マッチングモジュール１６は、図１に示すように、代表文字形状生成モジュール１３、フォントデータベース１５、代表文字形状符号化モジュール１７と接続されており、フォントデータベース１５から渡されたフォント画像と代表文字形状生成モジュール１３によって生成された代表文字形状とのマッチング処理を行う。すなわち、フォントデータベース１５で生成された複数のフォント画像の中から、代表文字形状に最も類似した画像を選択する。ここで、複数のフォント画像の中に代表文字形状に似た画像が存在しない場合は、フォント画像を選択しなくてもよい。
代表文字形状符号化モジュール１７は、図１に示すように、文字マッチングモジュール１６と接続されており、最も類似したフォント画像を符号化する。もしくは、複数のフォント画像の中に代表文字形状に似た画像が存在しない場合は、代表文字形状生成モジュール１３で生成された代表文字形状をそのまま符号化する。ここでは、代表文字形状と文字番号とのリンク情報も符号化する。そして、その符号を外部へ送信する。

次に、図３を用いて、第１の実施の形態である符号化装置の作用・働き（動作）を説明する。
ステップＳ３０２では、同一文字領域抽出モジュール１１が入力画像から同等の形状の領域を抽出する。
ステップＳ３０４では、代表文字形状生成モジュール１３が、ステップＳ３０２で抽出された複数の領域を基にして、代表の文字形状を生成する。
ステップＳ３０６では、文字認識モジュール１４が、ステップＳ３０４で生成された代表文字形状を文字認識する。

ステップＳ３０８では、フォントデータベース１５が、ステップＳ３０６での文字認識処理の結果である文字コードを基にして、複数のフォント画像を生成する。
ステップＳ３１０では、文字マッチングモジュール１６が、ステップＳ３０４で生成された代表文字形状とステップＳ３０８で生成されたフォント画像とのマッチング処理を行い、最も類似したフォント画像を選択する。
ステップＳ３１２では、代表文字形状符号化モジュール１７が、ステップＳ３１０で選択したフォント画像を符号化する。

ステップＳ３１４では、文字番号、文字位置符号化モジュール１２が、ステップＳ３０２で抽出された文字番号とその文字の位置を符号化する。
ステップＳ３１６では、ステップＳ３０２で抽出された全ての領域に対して、ステップＳ３０４からステップＳ３１４の処理が終了したか否かを判断する。終了していなければ、ステップＳ３０４へ戻り、終了していれば、入力画像に対しての符号化は終了したことになる（ステップＳ３１８）。

第１の実施の形態である復号装置は、図２に示すように、文字番号、文字位置復号モジュール２１、代表文字形状復号モジュール２２、文字復号モジュール２３を有している。第１の実施の形態の符号化装置で符号化された符号は、本復号装置で復号可能である。
文字番号、文字位置復号モジュール２１は、図２に示すように、文字復号モジュール２３と接続されており、第１の実施の形態の符号化装置の文字番号、文字位置符号化モジュール１２で符号化された各文字の文字番号と文字位置を復号する。復号後の文字番号と文字位置を文字復号モジュール２３へ渡す。

代表文字形状復号モジュール２２は、図２に示すように、文字復号モジュール２３と接続されており、第１の実施の形態の符号化装置の代表文字形状符号化モジュール１７で符号化された代表文字形状、そして代表文字形状と文字番号とのリンク情報を復号する。復号後の代表文字形状、そして代表文字形状と文字番号とのリンク情報を文字復号モジュール２３へ渡す。
文字復号モジュール２３は、図２に示すように、文字番号、文字位置復号モジュール２１、代表文字形状復号モジュール２２と接続されており、各文字位置に文字番号から得られる代表文字形状を貼り付けて、文字を復号する。つまり、第１の実施の形態の符号化装置の同一文字領域抽出モジュール１１が入力した画像を生成することになる。
なお、上記復号装置は、ＪＢＩＧ２のテキストリージョン復号装置であってもよい。

次に、図４を用いて、第１の実施の形態である復号装置の作用・働き（動作）を説明する。
ステップＳ４０２では、文字番号、文字位置復号モジュール２１が、入力された符号から文字番号と文字位置を復号する。
ステップＳ４０４では、代表文字形状復号モジュール２２が、入力された符号から代表文字形状、そして代表文字形状と文字番号とのリンク情報を復号する。
ステップＳ４０６では、文字復号モジュール２３が、ステップＳ４０２で復号された文字番号と文字位置、ステップＳ４０４で復号された代表文字形状、そして代表文字形状と文字番号とのリンク情報に基づいて、文字の復号（つまり、画像への貼り付け）を行う。
ステップＳ４０８では、入力されてくる符号の全ての復号が終了したか否かを判断する。終了していなければ、ステップＳ４０２へ戻り、終了していれば、復号は終了したことになる（ステップＳ４１０）。

図５〜図８は、第２の実施の形態を説明する図面である。図５、図６は、第２の実施の形態の概念的なモジュール構成図を示している。
なお、第１の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第１の実施の形態の符号化装置では、代表文字形状符号化モジュール１７は、代表文字形状として、フォント画像をそのまま符号化して送ったが、フォント画像を送る必要は必ずしもなく、フォント画像生成情報を送ればよい。フォント画像生成情報、つまりベクタフォントであれば、ベクタ情報を送ればよい。ＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）（登録商標）でフォント情報を含んだファイル生成方法があるが、それと同じ方式をとることができる。

第２の実施の形態である符号化装置は、図５に示すように、同一文字領域抽出モジュール１１、文字番号、文字位置符号化モジュール１２、代表文字形状生成モジュール１３、文字認識モジュール１４、フォントデータベース１５、文字マッチングモジュール１６、フォント生成情報符号化モジュール５７を有している。
第２の実施の形態である符号化装置は、第１の実施の形態の符号化装置の代表文字形状符号化モジュール１７の代わりにフォント生成情報符号化モジュール５７としたものである。残りのモジュールは第１の実施の形態の符号化装置と同様である。
フォント生成情報符号化モジュール５７は、図５に示すように、文字マッチングモジュール１６と接続されており、文字マッチングモジュール１６によって選択されたフォント画像を生成する情報であるフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を符号化する。なお、フォント画像生成情報は、フォントデータベース１５に記憶されていてもよく、文字マッチングモジュール１６はフォント画像生成情報を用いて、マッチングするフォント画像を生成するようにしてもよい。
代表文字形状と一致するフォント画像が無い場合には、第１の実施の形態の符号化装置と同様に代表文字形状符号化モジュール１７を用いて、別途代表文字形状を符号化すればよい。
フォント生成情報量が小さいと判断した場合には、符号化を行わないようにしてもよい。

次に、図７を用いて、第２の実施の形態である符号化装置の作用・働き（動作）を説明する。
ステップＳ７０２からステップＳ７１０までの処理は、図３で示したステップＳ３０２からステップＳ３１０までの処理と同様である。
ステップＳ７１２では、フォント生成情報符号化モジュール５７が、ステップＳ７１０で選択したフォント画像のフォント画像生成情報を符号化する。
ステップＳ７１４からステップＳ７１８までの処理は、図３で示したステップＳ３１４からステップＳ３１８までの処理と同様である。

第２の実施の形態である復号装置は、図６に示すように、文字番号、文字位置復号モジュール２１、フォント生成情報復号フォント画像生成モジュール６２、文字復号モジュール２３を有している。第２の実施の形態の符号化装置で符号化された符号は、本復号装置で復号可能である。
第２の実施の形態である復号装置は、第１の実施の形態の復号装置の代表文字形状復号モジュール２２の代わりにフォント生成情報復号フォント画像生成モジュール６２としたものである。残りのモジュールは第１の実施の形態の復号装置と同様である。
フォント生成情報復号フォント画像生成モジュール６２は、図６に示すように、文字復号モジュール２３と接続されており、第２の実施の形態の符号化装置のフォント生成情報符号化モジュール５７で符号化されたフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を復号する。復号後のフォント画像生成情報からフォント画像を生成し、そして、フォント画像、フォント画像生成情報と文字番号とのリンク情報を文字復号モジュール２３へ渡す。

次に、図８を用いて、第２の実施の形態である復号装置の作用・働き（動作）を説明する。
ステップＳ８０２の処理は、図４で示したステップＳ４０２の処理と同様である。
ステップＳ８０４では、フォント生成情報復号フォント画像生成モジュール６２が、入力された符号からフォント画像生成情報、そしてフォント画像生成情報と文字番号とのリンク情報を復号する。
ステップＳ８０６では、フォント生成情報復号フォント画像生成モジュール６２が、フォント画像生成情報からフォント画像を生成する。
ステップＳ８０８、ステップＳ８１０の処理は、図４で示したステップＳ４０６、ステップＳ４０８の処理と同様である。

図９〜図１２は、第３の実施の形態を説明する図面である。図９、図１０は、第３の実施の形態の概念的なモジュール構成図を示している。
なお、第１の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
第３の実施の形態である符号化装置は、図９に示すように、同一文字領域抽出モジュール１１、文字コード、文字位置符号化モジュール９２、代表文字形状生成モジュール１３、文字認識モジュール１４、フォントデータベース１５、文字マッチングモジュール１６、フォント種符号化モジュール９７を有している。
第３の実施の形態である符号化装置は、第１の実施の形態の符号化装置の代表文字形状符号化モジュール１７の代わりにフォント種符号化モジュール９７、文字番号、文字位置符号化モジュール１２の代わりに文字コード、文字位置符号化モジュール９２としたものである。残りのモジュールは第１の実施の形態の符号化装置と同様である。

第２の実施の形態ではフォント画像生成情報を符号化したが、このフォント画像生成情報を符号化せずに、文字コードを符号化することも可能である。ただし、この場合には、対応する復号装置にフォントデータベースが必要となる。
第３の実施の形態のフォント種符号化モジュール９７は、図９に示すように、文字マッチングモジュール１６と接続されており、文字マッチングモジュール１６による文字のマッチング処理の結果、フォント種（フォント種、フォントサイズや強調の種類など）を得てそれを符号化する。
代表文字形状と一致するフォント画像が無い場合には、第１の実施の形態の符号化装置と同様に代表文字形状符号化モジュール１７を用いて、別途代表文字形状を符号化すればよい。
フォント種のデータ量が小さいと判断した場合には、符号化を行わないようにしてもよい。

また、文字コード、文字位置符号化モジュール９２は、図９に示すように、同一文字領域抽出モジュール１１、文字認識モジュール１４と接続されており、文字認識モジュール１４による文字認識の結果である文字コード及び文字位置を符号化する。また、文字コードの代わりに、文字番号を符号化してもよい。文字番号を符号化する場合には、文字コードと文字番号のリンク情報も符号化すればよい。文字コードは、ＪＩＳやＡＳＣＩＩコードであってもよい。文字番号は、この符号内のみで使用される代表文字形状とのリンク番号を示している。一般に文字番号の方が文字コードよりもビット幅を小さくすることができるため、より圧縮率を高める場合がある。

次に、図１１を用いて、第３の実施の形態である符号化装置の作用・働き（動作）を説明する。
ステップＳ１１０２からステップＳ１１１０までの処理、ステップＳ１１１６の処理は、図３で示したステップＳ３０２からステップＳ３１０までの処理、ステップＳ３１６の処理と同様である。
ステップＳ１１１２では、フォント種符号化モジュール９７が、ステップＳ１１１０で選択したフォントのフォント種を符号化する。
ステップＳ１１１４では、文字コード、文字位置符号化モジュール９２が、ステップＳ１１０６で得た文字認識結果である文字コードとステップＳ１１０２で抽出されたその文字の位置を符号化する。

第３の実施の形態である復号装置は、図１０に示すように、フォント種復号モジュール１０１、文字コード、文字位置復号モジュール１０２、フォントデータベース・フォント画像生成モジュール１０３、文字復号モジュール１０４を有している。第３の実施の形態の符号化装置で符号化された符号は、本復号装置で復号可能である。
フォント種復号モジュール１０１は、図１０に示すように、フォントデータベース・フォント画像生成モジュール１０３と接続されており、第３の実施の形態の符号化装置のフォント種符号化モジュール９７で符号化されたフォント種を復号する。復号後のフォント種をフォントデータベース・フォント画像生成モジュール１０３へ渡す。
文字コード、文字位置復号モジュール１０２は、図１０に示すように、フォントデータベース・フォント画像生成モジュール１０３、文字復号モジュール１０４と接続されており、第３の実施の形態の符号化装置の文字コード、文字位置符号化モジュール９２で符号化された各文字の文字コードと文字位置を復号する。復号後の文字コードをフォントデータベース・フォント画像生成モジュール１０３へ渡し、文字位置を文字復号モジュール１０４へ渡す。
フォントデータベース・フォント画像生成モジュール１０３は、図１０に示すように、フォント種復号モジュール１０１、文字コード、文字位置復号モジュール１０２、文字復号モジュール１０４と接続されており、フォント種復号モジュール１０１からのフォント種と文字コード、文字位置復号モジュール１０２からの文字コードからフォントデータベースにより該当するフォント画像を生成する。生成したフォント画像を文字復号モジュール１０４へ渡す。
文字復号モジュール１０４は、図１０に示すように、文字コード、文字位置復号モジュール１０２、フォントデータベース・フォント画像生成モジュール１０３と接続されており、文字コード、文字位置復号モジュール１０２からの文字位置に、フォントデータベース・フォント画像生成モジュール１０３からのフォント画像を貼り付けて文字を復号する。つまり、第３の実施の形態の符号化装置の同一文字領域抽出モジュール１１が入力した画像を生成することになる。

次に、図１２を用いて、第３の実施の形態である復号装置の作用・働き（動作）を説明する。
ステップＳ１２０２では、フォント種復号モジュール１０１が、入力された符号からフォント種を復号する。
ステップＳ１２０４では、文字コード、文字位置復号モジュール１０２が、入力された符号から文字コードと文字位置を復号する。
ステップＳ１２０６では、フォントデータベース・フォント画像生成モジュール１０３が、ステップＳ１２０２で復号されたフォント種及びステップＳ１２０４で復号された文字コードを用いて、フォント画像を生成する。
ステップＳ１２０８では、文字復号モジュール１０４が、ステップＳ１２０６で生成したフォント画像をステップＳ１２０４で復号した文字位置に貼り付けて、文字を復号する。
ステップＳ１２１０では、入力されてくる符号の全ての復号が終了したか否かを判断する。終了していなければ、ステップＳ１２０２へ戻り、終了していれば、復号は終了したことになる（ステップＳ１２１２）。

図１３を参照して、第１〜第３の実施の形態のハードウェア構成例について説明する。図１３に示す構成は、例えばパーソナルコンピュータ（ＰＣ）などによって構成される画像処理システムであり、スキャナ等のデータ読み取り部１３１７と、プリンタなどのデータ出力部１３１８を備えたハードウェアの構成例を示している。前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。なお、このハードウェア構成は、他の実施の形態についても適用する。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１３０１は、上述の実施の形態において説明した各種のモジュール、すなわち、同一文字領域抽出モジュール１１、文字番号、文字位置符号化モジュール１２、代表文字形状生成モジュール１３、文字認識モジュール１４等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３０２は、ＣＰＵ１３０１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３０３は、ＣＰＵ１３０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバスなどから構成されるホストバス１３０４により相互に接続されている。

ホストバス１３０４は、ブリッジ１３０５を介して、例えばＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス１３０６に接続されている。

キーボード１３０８、マウス等のポインティングデバイス１３０９は、操作者により操作される入力デバイスである。ディスプレイ１３１０は、例えば液晶表示装置又はＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）などから成り、各種情報をテキストやイメージ情報として表示する。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３１１は、ハードディスクを内蔵し、ハードディスクを駆動し、ＣＰＵ１３０１によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、入力画像や文字認識モジュール１４による認識結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。

ドライブ１３１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体１３１３に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース１３０７、外部バス１３０６、ブリッジ１３０５、及びホストバス１３０４を介して接続されているＲＡＭ１３０３に供給する。リムーバブル記録媒体１３１３も、ハードディスクと同様のデータ記録領域として利用可能である。

接続ポート１３１４は、外部接続機器１３１５を接続するポートであり、例えばＵＳＢ、ＩＥＥＥ１３９４等の接続部を持つ。接続ポート１３１４は、インタフェース１３０７、及び外部バス１３０６、ブリッジ１３０５、ホストバス１３０４等を介してＣＰＵ１３０１等に接続されている。通信部１３１６は、例えばネットワークインタフェースカード（ＮＩＣ）であり、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部１３１７は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部１３１８は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

なお、図１３に示すハードウェア構成は、１つの構成例を示すものであり、本実施の形態の画像処理システムは、図１３に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア（例えばＡＳＩＣ等）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図１３に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機（多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している）などに組み込まれていてもよい。

前述の実施の形態の符号化装置においては、文字認識モジュール１４が文字認識を行っているが、文字認識を行わなくてもよい。つまり、代表文字形状生成モジュール１３とフォントデータベース１５が接続され、フォントデータベース１５において、全ての文字種の画像生成を行うようにしてもよい。

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）等が含まれる。
そして、上記のプログラム又はその一部は、上記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。

第１の実施の形態（符号化装置）の構成例についての概念的なモジュール構成図である。第１の実施の形態（復号装置）の構成例についての概念的なモジュール構成図である。第１の実施の形態（符号化装置）が行う符号化処理のフローチャートである。第１の実施の形態（復号装置）が行う復号処理のフローチャートである。第２の実施の形態（符号化装置）の構成例についての概念的なモジュール構成図である。第２の実施の形態（復号装置）の構成例についての概念的なモジュール構成図である。第２の実施の形態（符号化装置）が行う符号化処理のフローチャートである。第２の実施の形態（復号装置）が行う復号処理のフローチャートである。第３の実施の形態（符号化装置）の構成例についての概念的なモジュール構成図である。第３の実施の形態（復号装置）の構成例についての概念的なモジュール構成図である。第３の実施の形態（符号化装置）が行う符号化処理のフローチャートである。第３の実施の形態（復号装置）が行う復号処理のフローチャートである。第１〜第３の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。従来技術による画質劣化を示す説明図である。

符号の説明

１１…同一文字領域抽出モジュール
１２…文字番号、文字位置符号化モジュール
１３…代表文字形状生成モジュール
１４…文字認識モジュール
１５…フォントデータベース
１６…文字マッチングモジュール
１７…代表文字形状符号化モジュール
２１…文字番号、文字位置復号モジュール
２２…代表文字形状復号モジュール
２３…文字復号モジュール
５７…フォント生成情報符号化モジュール
６２…フォント生成情報復号フォント画像生成モジュール
９２…文字コード、文字位置符号化モジュール
９７…フォント種符号化モジュール
１０１…フォント種復号モジュール
１０２…文字コード、文字位置復号モジュール
１０３…フォントデータベース・フォント画像生成モジュール
１０４…文字復号モジュール

Claims

入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
を具備することを特徴とする画像処理装置。
さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項１に記載の画像処理装置。
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
を具備することを特徴とする画像符号化装置。
さらに、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
を具備し、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項３に記載の画像符号化装置。
前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする請求項３又は４に記載の画像符号化装置。
前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする請求項３又は４に記載の画像符号化装置。
さらに、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
を具備することを特徴とする請求項４に記載の画像符号化装置。
コンピュータを、
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較する比較手段
として機能させることを特徴とする画像処理プログラム。
さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項８に記載の画像処理プログラム。
入力画像から同等の形状である領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された同等の形状である領域に基づいて、該領域を代表する形状である代表形状を生成する代表形状生成手段と、
フォントの画像を生成するフォント画像生成手段と、
前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、類似するフォント画像を選択するフォント選択手段と、
前記フォント選択手段によって選択されたフォント画像を符号化する符号化手段
として機能させることを特徴とする画像符号化プログラム。
さらに、前記コンピュータを、
前記代表形状生成手段によって生成された代表形状を文字として認識する文字認識手段
として機能させ、
前記フォント画像生成手段は、前記文字認識手段による認識結果に基づいて、フォントの画像を生成する
ことを特徴とする請求項１０に記載の画像符号化プログラム。
前記符号化手段は、前記フォント選択手段によって選択されたフォント画像を生成する情報であるフォント画像生成情報を符号化する
ことを特徴とする請求項１０又は１１に記載の画像符号化プログラム。
前記フォント選択手段は、前記フォント画像生成手段によって生成されたフォント画像と前記代表形状生成手段によって生成された代表形状を比較して、フォントの種類であるフォント種を選択し、
前記符号化手段は、前記フォント選択手段によって選択されたフォント種を符号化する
ことを特徴とする請求項１０又は１１に記載の画像符号化プログラム。
さらに、前記コンピュータを、
前記文字認識手段による認識結果である文字コードを符号化する文字コード符号化手段
として機能させることを特徴とする請求項１１に記載の画像符号化プログラム。