JP2005301663A

JP2005301663A - 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム

Info

Publication number: JP2005301663A
Application number: JP2004116647A
Authority: JP
Inventors: Shunichi Kimura; 俊一木村; Yutaka Koshi; 裕越
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2004-04-12
Filing date: 2004-04-12
Publication date: 2005-10-27
Anticipated expiration: 2024-04-12
Also published as: CN1684492A; CN1684492B; US20050226517A1; US7889926B2; JP4788106B2

Abstract

【課題】高い符号化効率を実現する画像辞書を作成し、この画像辞書を適用して符号化する符号化装置を提供する。
【解決手段】画像処理装置２は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得し、取得された文字コードに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別するインデクスを付与し、入力画像に含まれている文字画像の出現位置情報と、この文字画像に対応する画像パターンのインデクスとを互いに対応付けて符号化する。
【選択図】図７

Description

本発明は、入力画像を構成する画像パターンとこの画像パターンの識別情報とを互いに対応付ける画像辞書を作成し、作成された画像辞書を符号化処理に適用する符号化装置に関する。

例えば、特許文献１は、写真画像、図形にて構成される第１の画像と文字にて構成される第２の画像を有する画像情報が入力され、この画像情報の中の第２の画像の領域を検出し、画像情報の中から第２の画像の領域を抜き取って記録する画像記録装置を開示する。これにより、第２の画像の領域内の文字を文字コードに変換して記録し、検索用キーワードとして用いることができる。また、特許文献２は、符号化側及び復号側に共通のフォントデータベースを備え、文字コード及びフォントの種類等を符号化する文字領域符号化方法を開示する。
特許第２８９５８３４号公報特開平１０−１７８６３８号公報

本発明は、上述した背景からなされたものであり、高い符号化効率を実現する画像辞書を作成し、この画像辞書を適用して符号化する符号化装置を提供することを目的とする。

［画像辞書作成装置］
上記目的を達成するために、本発明にかかる画像辞書作成装置は、入力画像に対する文字認識処理の結果を取得する情報取得手段と、前記情報取得手段により取得された文字認識処理の結果に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。

好適には、前記情報取得手段は、文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字識別情報を取得し、前記文字分類手段は、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する。

好適には、文字識別情報には文字コードが含まれており、前記文字分類手段は、入力画像に含まれる文字画像を文字コード毎に分類し、前記類型決定手段は、同一の文字コードに分類された文字画像に基づいて、これらの文字画像に対応する画像パターンを決定する。

好適には、前記情報取得手段は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得し、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段をさらに有し、前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を複数の文字画像群に分類し、前記類型決定手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、画像パターンを決定する。

好適には、前記文字画像抽出手段により抽出された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、各画像パターンの識別情報に対応付けて、それぞれの画像パターンに対応する文字画像それぞれの文字領域情報を出力する出力手段とをさらに有する。

好適には、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像の一致度合いを判定する一致判定手段をさらに有し、前記類型決定手段は、前記一致判定手段により判定された一致度合いに基づいて、同一の文字画像群に分類された複数の文字画像について、１つ以上の画像パターンを決定し、前記識別情報付与手段は、前記類型決定手段により同一の文字画像群について決定された１つ以上の画像パターンそれぞれに対して、それぞれの画像パターンを識別する識別情報を付与する。

好適には、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像に含まれる領域毎の一致度合いを判定する一致判定手段をさらに有し、前記類型決定手段は、前記一致判定手段により領域毎に判定された一致度合いに基づいて、文字画像を構成する複数の画像パターンを決定する。

好適には、前記情報取得手段は、さらに、文字認識処理の認識確度情報をそれぞれの文字識別情報又は文字領域情報に対応付けて取得し、前記文字分類手段は、認識確度情報と、これに対応する文字識別情報又は文字領域情報とに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する。

また、本発明にかかる画像辞書作成装置は、入力画像を構成する類型的な画像パターンを記憶するパターン記憶手段と、新たに入力された文字画像と、前記パターン記憶手段により記憶された画像パターンとを比較して、一致度合いを判定する一致判定手段と、前記一致判定手段により判定された一致判定度合いに応じて、この新たに入力された文字画像を画像パターンとして前記パターン記憶手段に記憶させる類型決定手段とを有する。

好適には、前記パターン記憶手段は、それぞれの画像パターンに対応付けて、これらの画像パターンが表す文字の識別情報を記憶し、入力された文字画像が表す文字の識別情報と、前記パターン記憶手段に記憶されている画像パターンの識別情報とに基づいて、前記一致度合い判定手段によりそれぞれの画像パターンに対して判定された一致度合いに対して重み付けを行う重み付け手段をさらに有し、前記類型決定手段は、前記重み付け手段により重み付けされた一致度合いに基づいて、この入力された文字画像に基づく画像パターンの登録を許可するか否かを決定する。

好適には、文字の識別情報は、文字コードであり、前記重み付け手段は、入力された文字画像の文字コードがいずれかの画像パターンの文字コードと一致する場合に、文字コードが相違する場合よりも一致度合いが高くなるように重み付けを行い、前記類型決定手段は、一致度合いが基準より高い場合に、この文字画像に基づく画像パターンの登録を禁止し、一致度合いが基準以下である場合に、この文字画像に基づく画像パターンの登録を許可する。

好適には、文字コードは、入力画像に対する文字認識処理により判定されたものであり、前記重み付け手段は、入力された文字画像に対する文字認識処理の認識確度に基づいて、認識確度が高いほど一致度合いが高くなるような重み付けを行う。

また、本発明にかかる画像辞書作成装置は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。

また、本発明にかかる画像辞書作成装置は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、前記文字画像抽出手段により抽出された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。

［符号化装置］
また、本発明にかかる符号化装置は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、前記取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する画像パターンの識別情報とを互いに対応付けて符号化する符号化手段とを有する。

また、本発明にかかる符号化装置は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、前記文字画像抽出手段により抽出された文字画像を、複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、少なくとも前記領域補正手段により補正されたそれぞれの文字画像の文字領域情報と、この文字画像が分類された文字画像群に基づいて決定された画像パターンの識別情報とを符号化する符号化手段とを有する。

［画像辞書作成方法］
また、本発明にかかる画像辞書作成方法は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得し、取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する。

［プログラム］
また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得するステップと、取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類するステップと、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。

また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、入力画像における文字画像それぞれの領域を示す文字領域情報を取得するステップと、取得された文字領域情報に基づいて、入力画像から文字画像を抽出するステップと、抽出された文字画像を、複数の文字画像群に分類するステップと、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。

本発明の符号化装置によれば、文字の可読性を保持しつつ、高い圧縮率を実現することができる。

［第１実施形態］
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置２は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等を符号化することにより、高い圧縮率を実現することができる。
図１（Ａ）は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図１（Ｂ）は、画像辞書の添付を前提とした符号化方法を説明する図である。
図１（Ａ）に示すように、文字画像を識別情報（文字コード及びフォントの種類）に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、文字画像の識別情報（文字コード及びフォントの種類等）と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを復号化側の画像処理装置に送信することができる。この場合に、復号化側の画像処理装置は、受信した符号データ（文字コード及びフォントの種類）を復号化し、復号化された文字コード及びフォントの種類、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成する。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも更新する必要がある。また、手書き文字等がフォント画像に置換されて再現性が低くなったり、手書き文字が非文字画像として取り扱われて符号量を小さくできないなど、手書き文字等に対する対応が十分でない。

そこで、本実施形態における画像処理装置２は、図１（Ｂ）に示すように、復号化側において、入力画像内で類型的に存在する画像パターンをインデクスに対応付けて登録（画像辞書化）し、入力画像に含まれる画像パターンを対応するインデクス及びその出現位置に置換して符号化する。符号化側は、画像パターン及びインデクスが互いに対応付けられた画像辞書と、符号化されたインデクス及び出現位置とを復号化側に送信する。復号化側は、インデクス及び出現位置を復号化し、復号化されたインデクスに対応する画像パターンを画像辞書から選択し、復号化された出現位置に配置する。
このように、画像処理装置２は、入力画像に応じて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。さらには、手書き文字等に対しても十分な再現性を維持しつつ符号量を小さくすることができる。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。

図２（Ａ）は、画像辞書を例示し、図２（Ｂ）は、画像パターンを例示する図である。
図２（Ａ）に例示するように、画像辞書には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクスとが含まれる。画像パターンは、入力画像に含まれる部分的な画像データであり、本例では入力画像（２値）中に既定回数以上（複数回）出現する類型的なパターン（２値データ）である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。

次に問題となるのは、どのような基準で入力画像から画像パターンを抽出し、画像辞書として登録するかという点である。抽出される画像パターンの大きさ及び出現頻度によって、入力画像の符号量が異なるからである。例えば、図２（Ｂ）に例示するように、文字画像単位で画像パターンが抽出される場合と、文字画像よりもさらに小さな単位で画像パターンが抽出される場合とが考えられる。
文字画像よりもさらに小さな単位で画像パターンが抽出される場合には、それぞれの画像パターンの出現頻度が高い場合が多いが（例えば、「１」の縦棒部分は、「山」及び「川」の一部として出現する）、画像辞書に登録すべき画像パターンの数が多くなり画像辞書のデータ量が大きくなる。
一方、文字画像単位で画像パターンが抽出される場合には、同一ドキュメント内では、同一の言語で同一のフォント種類及び同一のフォントサイズの文字が多数出現するため、画像パターンのサイズが大きい割には高い出現頻度が期待できる。
また、ある程度の非可逆性を許容して高い圧縮率を目指す場合に、符号化側の画像処理装置は、画像パターンと同一の部分画像だけでなく、画像パターンと類似する部分画像もインデクスに置換して符号化する。この場合に、文字画像の部分それぞれが、類似する画像パターンに置換されると、文字画像全体として全く異なるものに復号化されて可読性を失う可能性もある。しかしながら、文字画像単位で画像パターンが抽出される場合には、文字画像の全体的な形状が類似する画像パターン（例えば、数字の「１」とアルファベットの「Ｉ」など）に置換されるため、ある程度可読性が維持される。
したがって、本実施形態における画像処理装置２は、文字画像単位で入力画像から画像パターンを抽出し、画像辞書に登録する。

［ハードウェア構成］
次に、画像処理装置２のハードウェア構成を説明する。
図３は、本発明にかかる画像辞書作成方法が適応される画像処理装置２のハードウェア構成を、制御装置２０を中心に例示する図である。
図３に例示するように、画像処理装置２は、ＣＰＵ２０２及びメモリ２０４などを含む制御装置２０、通信装置２２、ＨＤＤ・ＣＤ装置などの記録装置２４、並びに、ＬＣＤ表示装置あるいはＣＲＴ表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置（ＵＩ装置）２６から構成される。
画像処理装置２は、例えば、符号化プログラム５（後述）がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置２２又は記録装置２４などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置１０に送信する。また、画像処理装置２は、プリンタ装置１０のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。

［符号化プログラム］
図４は、制御装置２０（図３）により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム５の機能構成を例示する図である。
図４に例示するように、符号化プログラム５は、画像入力部４０、画像辞書作成部５０及び符号化部６０を有する。
符号化プログラム５において、画像入力部４０（情報取得手段）は、プリンタ装置１０のスキャナ機能により読み取られた画像データ、又は、通信装置２２又は記録装置２４などを介して取得されたＰＤＬ（Page Discription Language）形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部５０に出力する。また、画像入力部４０は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部４１０と、ＰＤＬ形式の画像データを解釈してラスタデータを生成するＰＤＬデコンポーザ４２０とを有する。
文字認識部４１０は、入力された画像データ（以下、入力画像）に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部５０に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード（ＡＳＣＩＩコード又はシフトＪＩＳコードなど）、又は、文字コードとフォントの種類との組合せなどである。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せである。
ＰＤＬデコンポーザ４２０は、ＰＤＬ形式の画像データを解釈してラスタライズされた画像データ（ラスタデータ）を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報及び文字領域情報を画像辞書作成部５０に対して出力する。

画像辞書作成部５０は、画像入力部４０から入力された入力画像に基づいて、この入力画像の符号化処理に用いられる画像辞書を作成し、作成された画像辞書と入力画像とを符号化部６０に対して出力する。より具体的には、画像辞書作成部５０は、文字認識部４１０又はＰＤＬデコンポーザ４２０から入力された文字識別情報及び文字領域情報に基づいて、入力画像から文字画像単位で画像パターンを抽出し、抽出された画像パターンにインデクスを付与して画像辞書とし符号化部６０に出力する。

符号化部６０（符号化手段）は、画像辞書作成部５０から入力された画像辞書に基づいて入力画像を符号化し、符号化された入力画像と画像辞書とを記録装置２４（図３）又はプリンタ装置１０（図３）などに出力する。より具体的には、符号化部６０は、画像辞書に登録された画像パターンと、入力画像に含まれる部分画像とを比較して、いずれかの画像パターンと一致又は類似する部分画像のデータを、この画像パターンに対応するインデクス及びこの部分画像の位置情報に置換する。さらに、符号化部６０は、部分画像と置き換えられたインデクス及び位置情報並びに画像辞書等をエントロピー符号化（ハフマン符号化、算術符号化又はＬＺ符号化など）により符号化してもよい。

図５は、第１の画像辞書作成部５０の機能をより詳細に説明する図である。
図５に示すように、画像辞書作成部５０は、記憶部５００、文字画像抽出部５１０、文字分類部５２０、一致判定部５３０、辞書決定部５４０（類型決定手段）、位置補正部５５０（領域補正手段）及びインデクス付与部５６０（識別情報付与手段）を有する。記憶部５００は、メモリ２０４（図３）及び記録装置２４（図３）を制御して、画像入力部４０（図４）から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。

文字画像抽出部５１０は、文字の位置情報に基づいて、入力画像から文字画像を切り出す。すなわち、文字画像抽出部５１０は、文字領域情報により示された領域を文字画像として入力画像から抽出する。抽出される文字画像は、文字認識部４１０により文字画像であると判定された領域である。なお、文字認識部４１０又はＰＤＬデコンポーザ４２０が文字画像を入力画像から切り出した状態で画像辞書作成部５０に出力してもよい。
文字分類部５２０は、文字コードに基づいて、入力画像から切り出された文字画像を複数の文字画像群に分類する。例えば、文字分類部５２０は、文字コードが一致する文字画像を同一の文字画像群に分類する。

一致判定部５３０は、入力画像から切り出された複数の文字画像を互いに比較して、一致度合いを判定する。ここで、一致度合いとは、複数の画像が互いに一致する程度を示す情報であり、例えば、２値画像が比較される場合に、２つの文字画像を重ねたときの互いに重なりあう画素の数（以下、一致画素数）、この一致画素数を正規化した一致画素率（例えば、一致画素数を全画素数で割ったもの）、又は、複数の文字画像を重ねたときの画素分布（ヒストグラム）などである。
また、一致判定部５３０は、複数の文字画像を複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部５３０は、最大の一致度合いを算出するために、複数の文字画像を互いにずらしながら比較する。
例えば、一致判定部５３０は、同一の文字画像群に分類された２つの文字画像（文字コードが一致する文字画像）を互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部５００に出力する。

辞書決定部５４０は、それぞれの文字画像群に含まれる文字画像に基づいて、画像辞書に登録すべき画像パターンを決定する。すなわち、辞書決定部５４０は、文字コードが一致する複数の文字画像に基づいて、登録すべき画像パターンを決定する。例えば、辞書決定部５４０は、文字コードが一致する複数の文字画像（後述する位置補正がなされた文字画像）の和結合パターンを、登録すべき画像パターンとする。なお、和結合パターンとは、複数の画像を互いに重ねあわせた場合の和集合の形状である。

位置補正部５５０は、一致判定部５３０から出力されたずらしベクトルに基づいて、文字画像の位置情報を補正する。すなわち、位置補正部５５０は、画像入力部４０から入力された位置情報を、文字コードが一致する複数の文字画像の一致度合いが最大となるように補正する。
インデクス付与部５６０は、入力画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部５００に出力する。

図６は、符号化部６０の機能をより詳細に説明する図である。
図６に示すように、符号化部６０は、パターン判定部６１０、位置情報符号化部６２０、インデクス符号化部６３０、画像符号化部６４０、辞書符号化部６５０、選択部６６０及び符号出力部６７０を有する。
パターン判定部６１０は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン（同一又は類似の画像パターン）を判定する。より具体的には、パターン判定部６１０は、入力画像から文字画像単位で切り出された部分画像（位置補正部５５０により補正がなされたもの）と、画像パターンとを重ねあわせて、一致判定部５３０（図５）と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部６１０は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部６２０に対して出力し、この画像パターンのインデクスをインデクス符号化部６３０に対して出力し、対応する画像パターンが発見されない場合には、この部分画像を画像符号化部６４０に対して出力する。

位置情報符号化部６２０は、パターン判定部６１０から入力された位置情報（すなわち、位置補正部５５０により補正された部分画像（文字画像）の位置情報）を符号化し、選択部６６０に対して出力する。例えば、位置情報符号化部６２０は、ＬＺ符号化又は算術符号化等を適用して、位置情報を符号化する。
インデクス符号化部６３０は、パターン判定部６１０から入力されたインデクスを符号化し、選択部６６０に対して出力する。例えば、インデクス符号化部６３０は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部６４０は、画像に適した符号化方式を適用して、パターン判定部６１０から入力された部分画像を符号化し、選択部６６０に対して出力する。
辞書符号化部６５０は、画像辞書作成部５０（図４，図５）から入力された画像辞書（画像パターンとインデクスとが互いに対応付けられたもの）を符号化し、符号出力部６７０に対して出力する。

選択部６６０は、パターン判定部６１０により部分画像に対応する画像パターンが発見された場合に、位置情報符号化部６２０から入力された位置情報の符号データと、インデクス符号化部６３０から入力されたインデクスの符号データとを互いに対応付けて符号出力部６７０に対して出力し、パターン判定部６１０により部分画像に対応する画像パターンが発見されなかった場合に、画像符号化部６４０により符号化された部分画像の符号データを符号出力部６７０に対して出力する。
符号出力部６７０は、選択部６６０から入力された符号データ（位置情報、インデクス及び部分画像の符号データ）と、辞書符号化部６５０から入力された符号データ（画像辞書の符号データ）とを互いに対応付けてプリンタ装置１０（図３）、記録装置２４（図３）又は通信装置２２（図３）に出力する。

［符号化動作］
次に、画像処理装置２による符号化処理の全体動作を説明する。
図７は、符号化プログラム５の第１の動作（Ｓ１）を示すフローチャートである。なお、本フローチャートでは、プリンタ装置１０のスキャナ機能により光学的に読み取られた２値の画像データが入力される場合を具体例として説明する。
図７に示すように、ステップ１０（Ｓ１０）において、画像入力部４０は、プリンタ装置１０（図３）から画像データ（２値）が入力されると、入力された画像データ（入力画像）を画像辞書作成部５０に対して出力する。また、画像入力部４０の文字認識部４１０（図４）は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を判定し、判定された文字コード及び位置情報を画像辞書作成部５０に対して出力する。

ステップ２０（Ｓ２０）において、画像辞書作成部５０の記憶部５００は、画像入力部４０から入力された入力画像、文字コード及び位置情報をメモリ２０４（図３）に記憶する。
文字画像抽出部５１０は、記憶部５００により記憶された位置情報に基づいて、入力画像における文字画像の範囲を特定し、特定された範囲から文字画像を切り出して記憶部５００に記憶する。なお、文字画像の切出しは、符号化対象となる全入力画像（例えば、１ページ又は１ドキュメント）についてなされる。

ステップ３０（Ｓ３０）において、文字分類部５２０は、文字画像抽出部５１０により抽出された文字画像を、文字認識部４１０（図４）から入力された文字コード毎に分類する。

ステップ４０（Ｓ４０）において、一致判定部５３０、辞書決定部５４０及び位置補正部５５０は、協働して、文字分類部５２０により分類された文字画像に基づいて画像辞書に登録する画像パターンを決定し、決定された画像パターンを画像辞書として記憶部５００に格納する。

ステップ５０（Ｓ５０）において、インデクス付与部５６０は、決定された画像パターンに対してインデクスを付与し、付与されたインデクスを画像パターンに対応付けて記憶部５００に格納する。付与されるインデクスは、少なくとも、符号化対象として入力された全入力画像について、それぞれの画像パターンを一意に識別するものである。
画像パターンの決定及びインデクスの付与が符号化対象として入力された全入力画像について終了すると、これらの画像パターン及びインデクスは、画像辞書として符号化部６０に出力される。

ステップ６０（Ｓ６０）において、符号化部６０は、画像辞書に登録された画像パターンと、入力画像に含まれる部分画像とを比較して、画像パターンと一致する部分画像が存在する場合に、この部分画像をインデクス及び位置情報に置換して符号化し、画像パターンと一致しない部分画像をそのまま符号化する。また、符号化部６０は、画像辞書を符号化する。
ステップ７０（Ｓ７０）において、符号化部６０は、インデクス、位置情報及び部分画像の符号データと、画像辞書の符号データとをプリンタ装置１０等に出力する。

図８は、第１の画像パターン決定処理（Ｓ４０）をより詳細に説明するフローチャートである。
図８に示すように、ステップ４０２（Ｓ４０２）において、一致判定部５３０は、文字コード毎に分類された文字画像を互いに比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部５３０は、文字画像群における黒画素の画素分布（ヒストグラム）を作成し、作成された画素分布と、この文字画像群に含まれる文字画像とを互いにずらしながら黒画素の一致画素数を算出する。なお、画素分布は、文字画像群に属する文字画像の黒画素を一致画素数が最大となる相対位置で領域毎に画素値を順次加算したヒストグラムである。
すなわち、文字画像群の画素分布をＱ（ｘ）、各文字画像の画素値をＰ（ｉ，ｘ）、位置ベクトルをｘ、文字画像群に属する各文字画像をｉ（１〜Ｎ：Ｎは文字画像群に属する文字画像の数）、文字画像ｉのずらしベクトルをｖｉとした場合に、一致判定部５３０は、以下の数式により一致画素数を算出する。
（一致画素数Ｋ）＝Σ｛Ｑ（ｘ）＊Ｐ（ｉ，ｘ−ｖｉ）｝（「Σ」は、変数ｘについての総和を示す）
なお、ｉ＝１の場合には、
Ｑ（ｘ）＝Ｐ（１，ｘ）
となり、
ｉ＞１の場合には、
Ｑ（ｘ）＝Ｐ（１，ｘ）＋Ｐ（２，ｘ−ｖ２）＋・・・＋Ｐ（ｉ−１，ｘ−ｖ（ｉ−１））
となる。

ステップ４０４（Ｓ４０４）において、位置補正部５５０は、一致判定部５３０により複数の相対位置で算出される一致画素数（一致度合い）に基づいて、文字認識部４１０から入力された位置情報の補正ベクトルを決定する。具体的には、位置補正部５５０は、一致判定部５３０により算出される一致画素数Ｋが最大となったときのずらしベクトルｖｉ（文字認識部４１０から入力された位置情報を基準として文字画像を変位させた２次元ベクトル）を補正ベクトルとする。

ステップ４０６（Ｓ４０６）において、一致判定部５３０は、同一の文字画像群に分類された複数の文字画像（補正ベクトルにより位置が補正されたもの）を比較して、各領域における画素値の一致度合いを算出する。具体的には、一致判定部５３０は、一致画素数が最大となる相対位置でこの文字画像群に含まれる全文字画像を重ねあわせ、それぞれの領域の黒画素を加算して画素分布（ヒストグラム）を作成する。すなわち、一致判定部５３０は、以下の数式により、それぞれの文字画像群に含まれる全文字画像（１〜Ｎ）についてＱ（ｘ）を算出する。
Ｑ（ｘ）＝ΣＰ（ｉ，ｘ−ｖｉ）

ステップ４０８（Ｓ４０８）において、辞書決定部５４０は、一致判定部５３０により算出された一致度合い（画素分布）に対して、閾値以下の分布数を除去する閾値処理を行う。具体的には、辞書決定部５４０は、一致判定部５３０により算出されたＱ（ｘ）を正規化してＱ’（ｘ）を算出し、算出されたＱ’（ｘ）に対して閾値処理を行う。すなわち、辞書決定部５４０は、以下の数式により分布確率Ｑ’（ｘ）を算出する。
Ｑ’（ｘ）＝Ｑ（ｘ）／Ｎ
次に、一致判定部５３０は、以下の条件式により、分布確率Ｑ’（ｘ）が基準値よりも小さい部分を除去してＱ”（ｘ）を算出する。
Ｑ’（ｘ）＞閾値Ａの場合に、Ｑ”（ｘ）＝１
上記以外の場合に、Ｑ”（ｘ）＝０

ステップ４１０（Ｓ４１０）において、辞書決定部５４０は、閾値処理後の画素分布について、分布数が０でない領域（黒画素の領域）が基準よりも広いか否かを判定し、基準以上ある場合に、Ｓ４１２の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理（Ｓ４０）を終了する。
具体的には、辞書決定部５４０は、上記Ｑ”（ｘ）が１となる画素の数が基準値以上であるか否かを判定し、基準値以上である場合に、画像パターンの登録を行い、基準値よりも小さい場合に、画像パターンの登録を行わない。

ステップ４１２（Ｓ４１２）において、辞書決定部５４０は、画素分布に基づいて、画像パターンを決定する。具体的には、辞書決定部５４０は、Ｑ”（ｘ）のパターンを画像辞書に登録する画像パターンに決定する。

図９は、符号化処理（Ｓ６０）をより詳細に説明するフローチャートである。なお、本フローチャートでは、図８で決定された画像パターンに基づいて符号化処理を行う場合を具体例として説明する。
図９に示すように、ステップ６０２（Ｓ６０２）において、パターン判定部６１０は、補正後の位置情報に基づいて入力画像から切り出された部分画像（すなわち、文字画像）と、画像辞書に登録された画像パターンとを比較して、一致画素数を算出する。なお、パターン判定部６１０は、一致判定部５３０から一致画素数を取得してもよい。
ステップ６０４（Ｓ６０４）において、パターン判定部６１０は、一致する画像パターンが存在するか否かを判定する。具体的には、パターン判定部６１０は、それぞれの画像パターンについて算出された一致画素数が許容範囲（例えば、部分画像の全画素に対して９０％以上）内であるか否かを判定し、許容範囲内である場合に、Ｓ６０６の処理に移行し、許容範囲外である場合に、Ｓ６１０の処理に移行する。

ステップ６０６（Ｓ６０６）において、パターン判定部６１０は、一致画素数が許容範囲内である画像パターンのうち、一致画素数が最大の画像パターンのインデクスを画像辞書から読み出し、読み出されたインデクスをインデクス符号化部６３０に対して出力し、この文字画像の位置情報（位置補正部５５０により補正されたもの）を位置情報符号化部６２０に対して出力する。
インデクス符号化部６３０は、パターン判定部６１０から入力されたインデクスを符号化し、インデクスの符号データを選択部６６０に対して出力する。

ステップ６０８（Ｓ６０８）において、位置情報符号化部６２０は、パターン判定部６１０から入力された位置情報を符号化し、位置情報の符号データを選択部６６０に対して出力する。
選択部６６０は、インデクス符号化部６３０から入力されたインデクスの符号データと、位置情報符号化部６２０から入力された位置情報の符号データとを互いに対応付けて符号出力部６７０に対して出力する。すなわち、選択部６６０は、部分画像毎に、インデクスと位置情報とを互いに対応付けられるように符号出力部６７０に出力する。

ステップ６１０（Ｓ６１０）において、パターン判定部６１０は、この部分画像（すなわち、対応する画像パターンが画像辞書に存在しなかった文字画像）を画像符号化部６４０に対して出力する。
画像符号化部６４０は、パターン判定部６１０から入力された部分画像の画像データを符号化し、部分画像の符号データを選択部６６０に対して出力する。
選択部６６０は、画像符号化部６４０から入力された部分画像の符号データを符号出力部６７０に対して出力する。

ステップ６１２（Ｓ６１２）において、パターン判定部６１０は、全ての部分画像について符号化処理が終了したか否かを判定し、符号化していない部分画像が存在する場合に、Ｓ６０２の処理に戻って、次の部分画像の符号化処理を行い、全ての部分画像が符号化された場合に、Ｓ６１４の処理に移行する。
ステップ６１４（Ｓ６１４）において、辞書符号化部６５０は、画像辞書作成部５０から入力された画像辞書（画像パターンとインデクスとを対応付けたもの）を符号化し、画像辞書の符号データを符号出力部６７０に対して出力する。

以上説明したように、本実施形態における画像処理装置２は、文字コードに基づいて分類された文字画像群それぞれに基づいて画像パターンを決定し画像辞書に登録するため、文書画像の可読性を維持しつつ効率的な符号化（高い圧縮率の符号化）を実現する。
また、本画像処理装置２は、同一の文字画像群に属する文字画像を互いに比較して文字画像の切出し位置（文字画像の位置情報）を補正するため、文字画像の切出し誤差又はフォントの違い等により発生する文字画像のずれを修正し、文字の配置を高い精度で再現することができる。なお、本実施形態では、画像処理装置２は、文字コードに基づいて文字画像を文字画像群に分類したが、フォントの種類及び文字画像の大きさ等の他の文字識別情報を用いて文字画像を分類してもよいし、文字コード、フォントの種類及び文字画像の大きさのいずれか２つ以上を組み合わせて文字画像を分類してもよい。

［変形例１］
次に、上記実施形態の第１の変形例を説明する。
図１０は、文字認識処理により同一の文字コードとして判定されうる文字画像を例示する図である。
図１０（Ａ）に例示するように、フォントの種類が異なる数字「１」は、文字認識部４１０によって、同一の文字コードとして判別されうる。したがって、上記実施形態では、これらフォントの異なる複数の数字「１」は同一の文字画像群に分類され、これらの文字画像に基づいて１つの画像パターンが登録される。しかしながら、これらの数字「１」は、互いに異なる形状を有し、復号化後の画像においてもこれら形状の相違を再現したい場合がある。また、大きさのみが異なる文字も同一の文字コードとして判別されうるが、これら大きさの相違も再現したい場合がある。
また、図１０（Ｂ）に例示するように、文字認識処理のミスにより、形状が類似する文字（例えば、数字「１」とアルファベット大文字「Ｉ」と）が同一の文字コードとして判別されうる。この場合、少なくとも形状が近似しているため、可読性に与える影響はそれほど大きくないが、これらを区別できるように再現したい場合もある。
そこで、第１の変形例における画像処理装置２は、文字コード毎に分類された文字画像群に、形状の異なる文字画像が混在している場合に、この文字画像群について２以上の画像パターンを決定し、それぞれの画像パターンを画像辞書に登録できるようにする。

図１１は、第２の画像パターン決定処理（Ｓ４２）のフローチャートである。なお、本図における各処理のうち、図８に示された処理と実質的に同一のものには同一の符号が付されている。
図１１に示すように、Ｓ４１０において、辞書決定部５４０が、閾値処理後の画素分布について、分布数が０でない領域（黒画素の領域）が基準よりも広いか否かを判定し、基準以上ある場合に、Ｓ４２２の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理（Ｓ４２）を終了する。
ステップ４２２（Ｓ４２２）において、辞書決定部５４０は、画素分布に基づいて、和結合パターンＱ”（ｘ）を決定する。
ステップ４２４（Ｓ４２４）において、辞書決定部５４０は、和結合パターンＱ”（ｘ）と、この文字画像群に属する文字画像との共通部分（積集合）を共通パターンとして抽出し、抽出された共通パターンを画像パターンに決定する。なお、辞書決定部５４０は、それぞれの文字画像に基づいて抽出された共通パターンすべてを画像辞書に登録するわけではなく、重複する共通パターンを排除して画像辞書に登録する。また、辞書決定部５４０は、それぞれの文字画像に基づいて抽出された複数の共通パターンのうち、黒画素の領域の違いが閾値以下である場合にも、重複するものとして排除してもよい。

図１２は、第１の変形例における画像パターンの決定方法を模式的に説明する図である。
図１２に示すように、文字コードで分類された文字画像の黒画素の分布確率Ｑ’（ｘ）は、画素位置ｘによって異なる数値を示す。これは、文字画像群の中に、形状が異なる文字画像が混在しているからである。分布確率Ｑ’（ｘ）は、閾値Ｂにより閾値処理がなされることにより、分布確率が低い部分を除去される。これにより、出現頻度が低い文字の差分形状（出現頻度の高い文字との差分）及びノイズ部分等を排除して、類型的な形状のみを画像パターンとすることができる。
辞書決定部５４０は、上記Ｓ４２２において、閾値Ｂ以上の部分を１とし、閾値Ｂよりも小さい部分を０とした和結合パターンＱ”（ｘ）を生成する。
次に、辞書決定部５４０は、Ｓ４２４において、和結合パターンＱ”（ｘ）と、文字画像群に属する各文字画像との共通部分を共通パターンとして抽出する。すなわち、辞書決定部５４０は、和結合パターンＱ”（ｘ）と、各文字画像の画素分布Ｐ（ｉ，ｘ−ｖｉ）とを積演算する。これにより、文字画像群の中に複数存在する類型的な文字画像の画像パターン＃１及び画像パターン＃２が抽出される。

以上説明したように、第１の変形例における画像処理装置２は、同一の文字コードにより分類された複数の文字画像に基づいて、類型的な複数の画像パターンを決定することができる。これにより、出現頻度が高ければ、フォント又は大きさ等が異なる文字画像もそれぞれ画像パターンとして画像辞書に登録され、復号化された画像においてこれらの文字画像がそれぞれ再現されることになる。

［変形例２］
次に、上記実施形態の第２の変形例を説明する。
図１３は、同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。
図１３（Ａ）に例示するように、フォントの種類が異なる数字「１」は、文字認識部４１０によって、同一の文字コードとして判別されうる。このように、文字コードによって分類された文字画像群は、大部分で同一の形状を有している。以下、文字画像群に属する複数の文字画像が共通して有する部分画像を共通形状といい、それぞれの文字画像とこの共通形状との差分となる部分画像を差分形状という。
図１３（Ｂ）に例示するように、これらの文字画像を構成する部分形状のうち、第１レベルパターンは、これらの文字画像の共通形状であるため出現頻度が特に高い。また、第２レベルパターンａ及び第２レベルパターンｂは、それぞれの文字画像に固有の部分形状であり、第１レベルパターンに比べると出現頻度が低い。
そこで、第２の変形例における画像処理装置２は、文字コード毎に分類された文字画像群に形状の異なる複数の文字画像が混在している場合に、これらの文字画像の共通形状及び差分形状をそれぞれ画像パターンとして画像辞書に階層的に登録する。

図１４は、第３の画像パターン決定処理（Ｓ４４）のフローチャートである。なお、本図における各処理のうち、図８に示された処理と実質的に同一のものには同一の符号が付されている。
図１４に示すように、Ｓ４１０において、辞書決定部５４０が、閾値処理後の画素分布について、分布数が０でない領域（黒画素の領域）が基準よりも広いか否かを判定し、基準以上ある場合に、Ｓ４４２の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理（Ｓ４４）を終了する。
ステップ４４２（Ｓ４４２）において、辞書決定部５４０は、分布確率Ｑ’（ｘ）において第１レベル閾値よりも大きな部分を共通形状の画像パターン（すなわち、第１レベルパターン）として抽出する。ここで、第１レベル閾値とは、文字画像群に属する文字画像が共通して有する共通形状と、他の形状とを分離するための基準であり、本例では、文字画像群に属するほぼ全ての文字画像で黒画素が存在する場合の分布確率（０．９５など）である。

ステップ４４４（Ｓ４４４）において、辞書決定部５４０は、分布確率Ｑ’（ｘ）から第１レベルパターンに相当する部分を０にして、第１レベルパターンに相当する部分が除去された分布確率Ｑ１（ｘ）を生成する。
次に、辞書決定部５４０は、この分布確率Ｑ１（ｘ）において第２レベル閾値以上の部分を１、第２レベル閾値より小さい部分を０として、第１レベルパターンが除去された和結合パターンＱ１”（ｘ）を生成する。ここで、第２レベル閾値とは、共通形状の差分としてそれぞれの文字画像を構成する差分形状であって文字画像群において出現頻度が高いものを分離するための基準であり、第１レベル閾値よりも低く、例えば、目標となる符号量及び画質に応じて設定される。
そして、辞書決定部５４０は、この和結合パターンＱ１”と、各文字画像の画素分布Ｐ（ｉ，ｘ−ｖｉ）とを積演算して、これらの共通部分であるＲｉ（ｘ）を抽出し、抽出されたＲｉ（ｘ）を差分形状の画像パターン（すなわち、第２レベルパターン）に決定する。

ステップ４４６（Ｓ４４６）において、辞書決定部５４０は、同一の文字画像群から生成された第１レベルパターン及び第２レベルパターンを互いに対応付けて画像辞書に登録する。より具体的には、辞書決定部５４０は、第１レベルパターン及び第２レベルパターンをそれぞれのインデクスにより階層的に対応付けて画像辞書に登録する。

図１５は、第２の変形例における画像パターンの決定方法を模式的に説明する図である。
図１５に示すように、文字コードで分類された文字画像の黒画素の分布確率Ｑ’（ｘ）は、画素位置ｘによって異なる数値を示す。このうち、分布確率が最も高い部分は、この文字画像群に属する文字画像に共通する形状（すなわち、共通形状）であると考えられる。そして、分布確率が存在する他の領域は、それぞれの文字画像と共通形状との差分に相当する形状（すなわち、差分形状）であると考えられる。
そこで、辞書決定部５４０は、共通形状（分布確率がほぼ最大となる領域）を抽出するための第１レベル閾値と、出現頻度の高い差分形状を抽出するための第２レベル閾値とを有している。
まず、辞書決定部５４０は、分布確率Ｑ’（ｘ）に対して第１レベル閾値により閾値処理を行い、第１レベルパターン（共通形状）に相当する部分を抽出する。次に、分布確率Ｑ’（ｘ）から、抽出された第１レベルパターンに相当する部分が除去されて、第２レベル閾値を基準として「１」又は「０」に変換されることにより、第２レベル和結合パターンＱ１”（ｘ）が生成される。
辞書決定部５４０は、この第２レベル和結合パターンＱ１”（ｘ）と、各文字画像ｉの画素分布Ｐ（ｉ，ｘ）とを積演算することにより、これらの共通部分である第２レベルパターンを抽出する。本例では、第２レベル和結合パターンＱ１”（ｘ）と「文字画像＃１」との共通部分は、第２レベルパターンａとなり、第２レベル和結合パターンＱ１”（ｘ）と「文字画像＃２」との共通部分は、第２レベルパターンｂとなる。
これにより、「文字画像＃１」は、第１レベルパターンと、第２レベルパターンａとの和としてそれぞれのインデクスに置換でき、「文字画像＃２」は、第１レベルパターンと、第２レベルパターンｂとの和としてインデクスに置換できる。

図１６は、第２の変形例における符号化処理（Ｓ６４）のフローチャートである。なお、本図における各処理のうち、図９に示された処理と実質的に同一のものには同一の符号が付されている。
図１６に示すように、Ｓ６０２において、パターン判定部６１０は、補正後の位置情報に基づいて入力画像から切り出された部分画像（すなわち、文字画像）と、画像辞書に登録された第１レベルパターンとを比較して、一致画素数を算出する。
ステップ６４２（Ｓ６４２）において、パターン判定部６１０は、入力された部分画像と一致する第１レベルパターンが存在するか否かを判定する。具体的には、パターン判定部６１０は、それぞれの第１レベルパターンについて算出された一致画素数が許容範囲（例えば、部分画像の全画素に対して９０％以上）内であるか否かを判定し、許容範囲内である場合に、Ｓ６４４の処理に移行し、許容範囲外である場合に、Ｓ６１０の処理に移行する。

ステップ６４４（Ｓ６４４）において、パターン判定部６１０は、一致画素数が許容範囲内である第１レベルパターンのうち、一致画素数が最大の第１レベルパターンのインデクスを画像辞書から読み出し、読み出されたインデクスをインデクス符号化部６３０に対して出力し、この文字画像の位置情報（位置補正部５５０により補正されたもの）を位置情報符号化部６２０に対して出力する。
ステップ６４６（Ｓ６４６）において、パターン判定部６１０は、この第１レベルパターンの形状と、入力された部分画像との差分形状を抽出する。
ステップ６４８（Ｓ６４８）において、パターン判定部６１０は、この第１レベルパターンと対応付けられている第２レベルパターンを画像辞書から読み出し、読み出された第２レベルパターンと、抽出された差分形状とを比較して一致画素数を算出する。パターン判定部６１０は、それぞれの第２レベルパターンについて算出された一致画素数が許容範囲（例えば、差分形状の全画素に対して９０％以上）内であるか否かを判定し、許容範囲内である場合に、Ｓ６５０の処理に移行し、許容範囲外である場合に、Ｓ６０８の処理に移行する。

ステップ６５０（Ｓ６５０）において、パターン判定部６１０は、一致画素数が許容範囲内である第２レベルパターンのうち、一致画素数が最大の第２レベルパターンのインデクスを画像辞書から読み出し、読み出されたインデクスを、上記第１レベルパターンのインデクスと対応付けてインデクス符号化部６３０に対して出力する。
なお、本例では、第１レベルパターン及び第２レベルパターンのいずれとも一致しない黒画素をノイズ等として除去しているが、これらの黒画素そのものを別途符号化してもよい。

以上説明したように、第２の変形例における画像処理装置２は、同一の文字コードにより分類された複数の文字画像を互いに比較して、共通形状と差分形状とを抽出し、抽出された共通形状及び差分形状を階層的に対応付けて画像辞書に登録する。これにより、高い圧縮率を実現しつつ、文字画像の再現性を高めることができる。
また、画像処理装置２は、共通形状と差分形状とを階層化し、共通形状の符号データから順に出力することにより、復号化側で復号化した符号データの量に応じて徐々に画像品質を改善するプログレッシブ伝送を実現することができる。

［変形例３］
次に、上記実施形態の第３の変形例を説明する。
文字認識部４１０による文字認識の正確性（確度）は、入力画像に含まれる文字画像毎に異なる場合がある。したがって、文字認識結果（文字コード）に基づいて分類された文字画像群には、形状の類似しない文字画像が混在する可能性がある。このように形状が類似しない文字画像が文字画像群に混在すると、画像辞書に登録される画像パターンが歪めらるなどの弊害が発生しうる。
そこで、第３の変形例における画像処理装置２は、文字認識処理の確度毎に、画像辞書を作成する。

図１７は、文字認識処理の確度毎に作成された画像辞書を例示する図である。
図１７に例示するように、第３の変形例における文字分類部５２０は、文字認識処理の確度を文字認識部４１０から取得し、取得された確度に応じて、入力画像に含まれる文字画像を分類する。本例の文字分類部５２０は、「確度が９０％以上」の文字画像群、「確度が７０％以上９０％未満」の文字画像群、及び、「確度が７０％未満」の文字画像群というように、確度の範囲によって文字画像を分類している。
さらに、文字分類部５２０は、それぞれの文字画像群を文字コードでさらに分類する。

一致判定部５３０は、確度及び文字コードにより分類された文字画像群それぞれについて、これらの文字画像群に含まれる文字画像を互いに比較して一致度合いを判定する。辞書決定部５４０は、確度及び文字コードにより分類された文字画像群それぞれについて、画像パターンを決定する。なお、辞書決定部５４０は、確度が低い文字画像群について画像パターンを決定する場合には、まず、確度が高い文字画像群について決定された画像パターンと、この文字画像群（確度が低い文字画像群）に属する各文字画像とを比較して、一致するか否かを判定し、一致する場合には、この文字画像を文字画像群から排除する。
以上説明したように、第３の変形例における画像処理装置２は、文字認識処理の確度毎に画像辞書を作成することにより、文字認識処理のミスによる画像辞書への影響を最小限に抑えることができる。

［第２実施形態］
次に、第２の実施形態を説明する。
上記第１の実施形態では、画像辞書作成部５０は、１ページ又は１ドキュメントなどの文字画像全部を用いて画像辞書を作成していたが、本実施形態における第２の画像辞書作成部５２は、１文字ずつ文字画像を比較して画像辞書に登録する。
図１８は、第２の画像辞書作成部５２の機能構成を説明する図である。
図１８に示すように、第２の実施形態における画像辞書作成部５２は、図５に示した第１の画像辞書作成部５０の各構成に加えて、登録制御部５７０を有する。
登録制御部５７０は、文字画像抽出部５１０により抽出された文字画像を画像パターンとして画像辞書に登録するか否かを判断し、画像辞書への新規登録を制御する。より具体的には、登録制御部５７０は、新規に入力された文字画像と画像辞書に登録された画像パターンとの一致度合いに基づいて、新規に入力された文字画像を画像パターンとして画像辞書に登録するか否かを判断する。例えば、登録制御部５７０は、既登録の画像パターンと、新たに入力された文字画像との一致度合いがいずれも基準以下である場合に、この文字画像を画像パターンとして画像辞書に登録するよう辞書決定部５４０に指示する。

図１９は、第２の実施形態における符号化プログラム５の第２の動作（Ｓ２）を示すフローチャートである。なお、本フローチャートでは、文字認識部４１０（図４）が、１文字ずつ、入力画像に含まれる文字画像の位置及びその文字コードを判定しそれぞれの文字画像（２値）を１文字ずつ切り出す場合を具体例として説明する。また、本図に示す各処理のうち、図７に示された処理と実質的に同一のものには同一の符号が付されている。
図１９に示すように、Ｓ１０において、画像入力部４０は、プリンタ装置１０（図３）から画像データ（２値）が入力されると、入力された画像データ（入力画像）を画像辞書作成部５０に対して出力する。また、画像入力部４０の文字認識部４１０（図４）は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を１文字ずつ判定し、判定された文字コード、位置情報及び文字画像（２値）を１文字ずつ画像辞書作成部５０に対して出力する。

ステップ２２（Ｓ２２）において、画像辞書作成部５０の記憶部５００は、画像入力部４０から１文字ずつ入力される文字画像、文字コード及び位置情報をメモリ２０４（図３）に記憶する。なお、画像入力部４０から、切り出された文字画像ではなく、入力画像全体が入力される場合には、文字画像抽出部５１０が、１文字分ずつ入力される文字コード及び位置情報に基づいて、入力画像から文字画像を１文字分ずつ切り出して記憶部５００に対して出力する。
ステップ４６（Ｓ４６）において、登録制御部５７０は、一致判定部５３０及び位置補正部５５０と協働して、新たに入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。

ステップ５２（Ｓ５２）において、登録制御部５７０は、入力された文字画像を画像パターンとして画像辞書に登録すると判定した場合に、Ｓ５４の処理に移行し、入力された文字画像を画像パターンとして登録しないと判定した場合に、Ｓ６２の処理に移行する。なお、登録しないと判定された文字画像の位置情報は、この文字画像と最も近似する画像パターンのインデクスと対応付けられて符号化部６０に対して出力される。
ステップ５４（Ｓ５４）において、インデクス付与部５６０は、新たに入力された文字画像（画像パターンとして登録されるもの）に対してインデクスを付与し、この文字画像及びインデクスを記憶部５００に対して出力し、この文字画像の位置情報及びインデクスを符号化部６０に対して出力する。

ステップ６２（Ｓ６２）において、符号化部６０は、画像辞書作成部５２（図１８）から１文字分ずつ入力されるインデクス及び位置情報を符号化し、プリンタ装置１０等に出力する。
ステップ８０（Ｓ８０）において、符号化プログラム５は、入力画像に含まれる文字画像全てについて処理が終了したか否かを判定し、終了したと判定された場合に、画像辞書を符号化してプリンタＯ装置１０等に出力して動作（Ｓ２）を終了し、終了していないと判定された場合に、Ｓ２２の処理に戻って、次の文字画像について処理を行う。

図２０は、第２の実施形態における画像パターン登録判定処理（Ｓ４６）をより詳細に説明するフローチャートである。なお、本図における各処理のうち、図８に示された処理と実質的に同一のものには同一の符号が付されている。
図２０に示すように、ステップ４６２（Ｓ４６２）において、一致判定部５３０は、新たに入力された文字画像と、記憶部５００により画像辞書として記憶されている画像パターンとを比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部５３０は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素数Ｋを算出する。
一致画素数Ｋは、以下の数式により算出される。
（一致画素数Ｋ）＝Σ｛Ｓ（ｘ）＊Ｐ（ｉ，ｘ−ｖｉ）｝
Ｓ（ｘ）：画像パターンの画素分布
次に、一致判定部５３０は、算出された一致画素数Ｋを正規化して、一致画素率Ｋ’を算出する。
一致画素率Ｋ’は、以下の数式により算出される。
（一致画素率Ｋ’）＝Ｋ／Ｍ
Ｍ：文字画像を構成する画素数

Ｓ４０４において、位置補正部５５０は、一致判定部５３０により複数の相対位置で算出される一致度合いに基づいて、文字認識部４１０から入力された位置情報の補正ベクトルを決定する。具体的には、位置補正部５５０は、一致判定部５３０により算出される一致画素率Ｋ’が最大となったときのずらしベクトルｖｉを補正ベクトルとする。

ステップ４６４（Ｓ４６４）において、登録制御部５７０は、一致判定部５３０により判定された一致画素率Ｋ’と、画像パターンの登録／非登録を決定するための基準値とを比較し、一致画素率Ｋ’が基準値以上である場合に、Ｓ４６６の処理に移行し、一致画素率Ｋ’が基準値よりも小さい場合に、Ｓ４７０の処理に移行する。

ステップ４６６（Ｓ４６６）において、登録制御部５７０は、この文字画像の画像辞書への登録を禁止する。さらに、登録制御部５７０は、この文字画像と最も近似する画像パターン（すなわち、一致画素率Ｋ’が最大の画像パターン）のインデクスを画像辞書から読み出す。
ステップ４６７（Ｓ４６７）において、登録制御部５７０は、読み出されたインデクスと、この文字画像の位置情報（位置補正部５５０により補正がなされたもの）とを符号化部６０に対して出力する。

ステップ４７０（Ｓ４７０）において、登録制御部５７０は、辞書決定部５４０に対して、新たに入力された文字画像を画像パターンとして画像辞書に登録するよう指示する。
辞書決定部５４０は、入力された文字画像（位置補正部５５０により位置補正がなされたもの）を画像パターンとして記憶部５００（画像パターン記憶手段）に登録する。

以上説明したように、第２の実施形態における画像処理装置２は、文字画像の位置情報に基づいて文字画像を１文字ずつ切り出し、切り出された文字画像を１文字ずつ画像辞書に登録するか否かを判定し、判定結果に基づいて符号化する。これにより、逐次的に符号化処理を行うことができる。

［変形例］
次に、第２の実施形態の変形例を説明する。
画像辞書作成部５２は、画像パターンとして画像辞書に登録された文字画像を文字コードに対応付けて記憶し、新たに入力された文字画像と、文字コードが一致する画像パターンとを優先的に比較して、一致度合いを判定する。例えば、辞書決定部５４０は、文字画像を画像パターンとして画像辞書に登録する場合に、この文字画像の文字コードを画像パターンに対応付けて登録する。一致判定部５３０は、新たに入力された文字画像と文字コードが一致する画像パターンのみを画像辞書から読み出し、読み出された画像パターンと、入力された文字画像とを比較して、一致画素率Ｋ’を算出する。登録制御部５７０は、文字コードが一致する画像パターンと入力された文字画像との一致画素率Ｋ’のみに基づいて、入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
これにより、画像辞書作成部５２は、一致度合いの判定処理の回数を減らすことができる。

また、画像辞書作成部５２は、入力される文字画像の文字コードに基づいて、判定される一致度合いに重み付けを行ってもよい。また、画像辞書作成部５２は、文字認識部４１０による文字認識処理の確度に基づいて、判定される一致度合いに重み付けを行ってもよい。

図２１（Ａ）は、文字コードに基づく重み付け処理の重み付け係数を例示し、図２１（Ｂ）は、文字認識処理の確度に基づく重み付け処理の重み付け係数を例示する図である。
図２１（Ａ）に例示するように、登録制御部５７０（重み付け手段）は、入力された文字画像の文字コードと画像パターンの文字コードとが一致するか否かに応じて、異なる重み付け係数を有し、一致判定部５３０により判定された一致度合い（例えば、一致画素率Ｋ’）に対して重み付けを行う。より具体的には、登録制御部５７０は、入力された文字画像の文字コードと画像パターンの文字コードとが一致する場合に、これらの文字コードが一致しない場合よりも一致画素率Ｋ’が大きくなるように重み付けを行う。すなわち、画像辞書作成部５２は、文字コードが一致する場合には文字画像が文字として画像パターンと同一であると推定されるため、画像としても一致又は近似するものと判定されるように一致度合いを加重する。
なお、文字コードに応じた重み付け処理は、文字コードの一致／不一致によるものに限定されるものではなく、例えば、特定の文字コードの組合せ（数字「１」とアルファベット「ｌ」のように形状が類似する組合せなど）に対応する重み付け係数を設定し、文字コードの組合せに応じてなされてもよいし、可読性の要求に応じた重み付け係数（例えば、漢字の文字コードとひらがなの文字コードとで異なる重み付け）を設定してなされてもよい。

また、図２１（Ｂ）に例示するように、登録制御部５７０（重み付け手段）は、入力された文字画像の文字認識処理の確度に応じて、異なる重み付け係数を有し、一致判定部５３０により判定された一致度合い（例えば、一致画素率Ｋ’）に対して重み付けを行う。より具体的には、登録制御部５７０は、文字認識処理の確度が高いほど、一致画素率Ｋ’が大きくなるように重み付けを行う。すなわち、画像辞書作成部５２は、文字認識処理の確度が低い場合に文字画像の切出し位置等も正確でない場合があるため、画像パターンと一致又は近似するものとして判定されるための基準を高くするよう重み付けを行う。また、登録制御部５７０は、文字コードの一致／不一致に基づく重み付け処理がなされることを前提とした場合に、文字認識処理の確度に応じて重み付けを行うことは好適である。

図２２は、本変形例における画像辞書作成部５２の動作（Ｓ４８）を説明するフローチャートである。なお、本図における各処理のうち、図２０に示された処理と実質的に同一のものには同一の符号が付されている。
図２２に示すように、Ｓ４６２及びＳ４０４において、一致判定部５３０は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素率Ｋ’を算出し、位置補正部５５０は、一致判定部５３０により算出される一致画素率Ｋ’に基づいて、補正ベクトルを算出する。

ステップ４８２（Ｓ４８２）において、登録制御部５７０は、文字コードが一致しているか否かに応じて、それぞれの画像パターンについて算出された一致画素率Ｋ’に重み付け係数を掛け合わせる。
さらに、登録制御部５７０は、この文字画像に対する文字認識処理の確度を文字認識部４１０から取得し、取得された文字認識処理の確度に応じて、一致画素率Ｋ’に重み付け係数をかけ合わせる。

Ｓ４６４において、登録制御部５７０は、文字コードの一致／不一致、及び、文字認識処理の確度に基づいて重み付けがなされた一致画素率Ｋ’と、基準値とを比較して、この文字画像を画像パターンとして画像辞書に登録するか否かを判定する。

このように、画像辞書作成部５２は、文字コードの一致／不一致及び文字認識処理の確度に基づいて、判定された一致度合いに重み付けを行うことにより、画像辞書により適切な画像パターンを登録することができる。

（Ａ）は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、（Ｂ）は、画像辞書の添付を前提とした符号化方法を説明する図である。（Ａ）は、画像辞書を例示し、（Ｂ）は、画像パターンを例示する図である。本発明にかかる画像辞書作成方法が適応される画像処理装置２のハードウェア構成を、制御装置２０を中心に例示する図である。制御装置２１（図３）により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム５の機能構成を例示する図である。第１の画像辞書作成部５０の機能をより詳細に説明する図である。符号化部６０の機能をより詳細に説明する図である。符号化プログラム５の第１の動作（Ｓ１）を示すフローチャートである。第１の画像パターン決定処理（Ｓ４０）をより詳細に説明するフローチャートである。符号化処理（Ｓ６０）をより詳細に説明するフローチャートである。文字認識処理により同一の文字コードとして判定されうる文字画像を例示する図である。第２の画像パターン決定処理（Ｓ４２）のフローチャートである。第１の変形例における画像パターンの決定方法を模式的に説明する図である。同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。第３の画像パターン決定処理（Ｓ４４）のフローチャートである。第２の変形例における画像パターンの決定方法を模式的に説明する図である。第２の変形例における符号化処理（Ｓ６４）のフローチャートである。文字認識処理の確度毎に作成された画像辞書を例示する図である。第２の画像辞書作成部５２の機能構成を説明する図である。第２の実施形態における符号化プログラム５の第２の動作（Ｓ２）を示すフローチャートである。第２の実施形態における画像パターン登録判定処理（Ｓ４６）をより詳細に説明するフローチャートである。（Ａ）は、文字コードに基づく重み付け処理の重み付け係数を例示し、（Ｂ）は、文字認識処理の確度に基づく重み付け処理の重み付け係数を例示する図である。本変形例における画像辞書作成部５２の動作（Ｓ４８）を説明するフローチャートである。

符号の説明

２・・・画像処理装置
５・・・符号化プログラム
４０・・・画像入力部
４１０・・・文字認識部
４２０・・・ＰＤＬデコンポーザ
５０，５２・・・画像辞書作成部
５００・・・記憶部
５１０・・・文字画像抽出部
５２０・・・文字分類部
５３０・・・一致判定部
５４０・・・辞書決定部
５５０・・・位置補正部
５６０・・・インデクス付与部
５７０・・・登録制御部
６０・・・符号化部
６１０・・・パターン判定部
６２０・・・位置情報符号化部
６３０・・・インデクス符号化部
６４０・・・画像符号化部
６５０・・・辞書符号化部
６６０・・・選択部
６７０・・・符号出力部

Claims

入力画像に対する文字認識処理の結果を取得する情報取得手段と、
前記情報取得手段により取得された文字認識処理の結果に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。
前記情報取得手段は、文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字識別情報を取得し、
前記文字分類手段は、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する
請求項１に記載の画像辞書作成装置。
文字識別情報には文字コードが含まれており、
前記文字分類手段は、入力画像に含まれる文字画像を文字コード毎に分類し、
前記類型決定手段は、同一の文字コードに分類された文字画像に基づいて、これらの文字画像に対応する画像パターンを決定する
請求項２に記載の画像辞書作成装置。
前記情報取得手段は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得し、
前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段
をさらに有し、
前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を複数の文字画像群に分類し、
前記類型決定手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、画像パターンを決定する
請求項１に記載の画像辞書作成装置。
前記文字画像抽出手段により抽出された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
各画像パターンの識別情報に対応付けて、それぞれの画像パターンに対応する文字画像それぞれの文字領域情報を出力する出力手段と
をさらに有する請求項４に記載の画像辞書作成装置。
前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像の一致度合いを判定する一致判定手段
をさらに有し、
前記類型決定手段は、前記一致判定手段により判定された一致度合いに基づいて、同一の文字画像群に分類された複数の文字画像について、１つ以上の画像パターンを決定し、
前記識別情報付与手段は、前記類型決定手段により同一の文字画像群について決定された１つ以上の画像パターンそれぞれに対して、それぞれの画像パターンを識別する識別情報を付与する
請求項１〜４のいずれかに記載の画像辞書作成装置。
前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像に含まれる領域毎の一致度合いを判定する一致判定手段
をさらに有し、
前記類型決定手段は、前記一致判定手段により領域毎に判定された一致度合いに基づいて、文字画像を構成する複数の画像パターンを決定する
請求項１〜４のいずれかに記載の画像辞書作成装置。
前記情報取得手段は、さらに、文字認識処理の認識確度情報をそれぞれの文字識別情報又は文字領域情報に対応付けて取得し、
前記文字分類手段は、認識確度情報と、これに対応する文字識別情報又は文字領域情報とに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する
請求項１〜７のいずれかに記載の画像辞書作成装置。
入力画像を構成する類型的な画像パターンを記憶するパターン記憶手段と、
新たに入力された文字画像と、前記パターン記憶手段により記憶された画像パターンとを比較して、一致度合いを判定する一致判定手段と、
前記一致判定手段により判定された一致判定度合いに応じて、この新たに入力された文字画像を画像パターンとして前記パターン記憶手段に記憶させる類型決定手段と
を有する画像辞書作成装置。
前記パターン記憶手段は、それぞれの画像パターンに対応付けて、これらの画像パターンが表す文字の識別情報を記憶し、
入力された文字画像が表す文字の識別情報と、前記パターン記憶手段に記憶されている画像パターンの識別情報とに基づいて、前記一致度合い判定手段によりそれぞれの画像パターンに対して判定された一致度合いに対して重み付けを行う重み付け手段
をさらに有し、
前記類型決定手段は、前記重み付け手段により重み付けされた一致度合いに基づいて、この入力された文字画像に基づく画像パターンの登録を許可するか否かを決定する
請求項９に記載の画像辞書作成装置。
文字の識別情報は、文字コードであり、
前記重み付け手段は、入力された文字画像の文字コードがいずれかの画像パターンの文字コードと一致する場合に、文字コードが相違する場合よりも一致度合いが高くなるように重み付けを行い、
前記類型決定手段は、一致度合いが基準より高い場合に、この文字画像に基づく画像パターンの登録を禁止し、一致度合いが基準以下である場合に、この文字画像に基づく画像パターンの登録を許可する
請求項１０に記載の画像辞書作成装置。
文字コードは、入力画像に対する文字認識処理により判定されたものであり、
前記重み付け手段は、入力された文字画像に対する文字認識処理の認識確度に基づいて、認識確度が高いほど一致度合いが高くなるような重み付けを行う
請求項１１に記載の画像辞書作成装置。
入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、
前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。
入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、
前記文字画像抽出手段により抽出された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
を有する画像辞書作成装置。
入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、
前記取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、
入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する画像パターンの識別情報とを互いに対応付けて符号化する符号化手段と
を有する符号化装置。
入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、
前記文字画像抽出手段により抽出された文字画像を、複数の文字画像群に分類する文字分類手段と、
前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、
前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
少なくとも前記領域補正手段により補正されたそれぞれの文字画像の文字領域情報と、この文字画像が分類された文字画像群に基づいて決定された画像パターンの識別情報とを符号化する符号化手段と
を有する符号化装置。
入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得し、
取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、
各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、
決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する
画像辞書作成方法。
コンピュータを含む画像辞書作成装置において、
入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得するステップと、
取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類するステップと、
各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、
決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップと
を前記画像辞書作成装置のコンピュータに実行させるプログラム。
コンピュータを含む画像辞書作成装置において、
入力画像における文字画像それぞれの領域を示す文字領域情報を取得するステップと、
取得された文字領域情報に基づいて、入力画像から文字画像を抽出するステップと、
抽出された文字画像を、複数の文字画像群に分類するステップと、
各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、
決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップと
を前記画像辞書作成装置のコンピュータに実行させるプログラム。