JP2005301663A - 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム - Google Patents

画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム Download PDF

Info

Publication number
JP2005301663A
JP2005301663A JP2004116647A JP2004116647A JP2005301663A JP 2005301663 A JP2005301663 A JP 2005301663A JP 2004116647 A JP2004116647 A JP 2004116647A JP 2004116647 A JP2004116647 A JP 2004116647A JP 2005301663 A JP2005301663 A JP 2005301663A
Authority
JP
Japan
Prior art keywords
image
character
pattern
input
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004116647A
Other languages
English (en)
Other versions
JP4788106B2 (ja
Inventor
Shunichi Kimura
俊一 木村
Yutaka Koshi
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004116647A priority Critical patent/JP4788106B2/ja
Priority to US11/067,904 priority patent/US7889926B2/en
Priority to CN2005100538710A priority patent/CN1684492B/zh
Publication of JP2005301663A publication Critical patent/JP2005301663A/ja
Application granted granted Critical
Publication of JP4788106B2 publication Critical patent/JP4788106B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Abstract

【課題】 高い符号化効率を実現する画像辞書を作成し、この画像辞書を適用して符号化する符号化装置を提供する。
【解決手段】 画像処理装置2は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字コードとを取得し、取得された文字コードに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別するインデクスを付与し、入力画像に含まれている文字画像の出現位置情報と、この文字画像に対応する画像パターンのインデクスとを互いに対応付けて符号化する。
【選択図】図7

Description

本発明は、入力画像を構成する画像パターンとこの画像パターンの識別情報とを互いに対応付ける画像辞書を作成し、作成された画像辞書を符号化処理に適用する符号化装置に関する。
例えば、特許文献1は、写真画像、図形にて構成される第1の画像と文字にて構成される第2の画像を有する画像情報が入力され、この画像情報の中の第2の画像の領域を検出し、画像情報の中から第2の画像の領域を抜き取って記録する画像記録装置を開示する。これにより、第2の画像の領域内の文字を文字コードに変換して記録し、検索用キーワードとして用いることができる。また、特許文献2は、符号化側及び復号側に共通のフォントデータベースを備え、文字コード及びフォントの種類等を符号化する文字領域符号化方法を開示する。
特許第2895834号公報 特開平10−178638号公報
本発明は、上述した背景からなされたものであり、高い符号化効率を実現する画像辞書を作成し、この画像辞書を適用して符号化する符号化装置を提供することを目的とする。
[画像辞書作成装置]
上記目的を達成するために、本発明にかかる画像辞書作成装置は、入力画像に対する文字認識処理の結果を取得する情報取得手段と、前記情報取得手段により取得された文字認識処理の結果に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。
好適には、前記情報取得手段は、文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字識別情報を取得し、前記文字分類手段は、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する。
好適には、文字識別情報には文字コードが含まれており、前記文字分類手段は、入力画像に含まれる文字画像を文字コード毎に分類し、前記類型決定手段は、同一の文字コードに分類された文字画像に基づいて、これらの文字画像に対応する画像パターンを決定する。
好適には、前記情報取得手段は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得し、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段をさらに有し、前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を複数の文字画像群に分類し、前記類型決定手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、画像パターンを決定する。
好適には、前記文字画像抽出手段により抽出された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、各画像パターンの識別情報に対応付けて、それぞれの画像パターンに対応する文字画像それぞれの文字領域情報を出力する出力手段とをさらに有する。
好適には、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像の一致度合いを判定する一致判定手段をさらに有し、前記類型決定手段は、前記一致判定手段により判定された一致度合いに基づいて、同一の文字画像群に分類された複数の文字画像について、1つ以上の画像パターンを決定し、前記識別情報付与手段は、前記類型決定手段により同一の文字画像群について決定された1つ以上の画像パターンそれぞれに対して、それぞれの画像パターンを識別する識別情報を付与する。
好適には、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像に含まれる領域毎の一致度合いを判定する一致判定手段をさらに有し、前記類型決定手段は、前記一致判定手段により領域毎に判定された一致度合いに基づいて、文字画像を構成する複数の画像パターンを決定する。
好適には、前記情報取得手段は、さらに、文字認識処理の認識確度情報をそれぞれの文字識別情報又は文字領域情報に対応付けて取得し、前記文字分類手段は、認識確度情報と、これに対応する文字識別情報又は文字領域情報とに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する。
また、本発明にかかる画像辞書作成装置は、入力画像を構成する類型的な画像パターンを記憶するパターン記憶手段と、新たに入力された文字画像と、前記パターン記憶手段により記憶された画像パターンとを比較して、一致度合いを判定する一致判定手段と、前記一致判定手段により判定された一致判定度合いに応じて、この新たに入力された文字画像を画像パターンとして前記パターン記憶手段に記憶させる類型決定手段とを有する。
好適には、前記パターン記憶手段は、それぞれの画像パターンに対応付けて、これらの画像パターンが表す文字の識別情報を記憶し、入力された文字画像が表す文字の識別情報と、前記パターン記憶手段に記憶されている画像パターンの識別情報とに基づいて、前記一致度合い判定手段によりそれぞれの画像パターンに対して判定された一致度合いに対して重み付けを行う重み付け手段をさらに有し、前記類型決定手段は、前記重み付け手段により重み付けされた一致度合いに基づいて、この入力された文字画像に基づく画像パターンの登録を許可するか否かを決定する。
好適には、文字の識別情報は、文字コードであり、前記重み付け手段は、入力された文字画像の文字コードがいずれかの画像パターンの文字コードと一致する場合に、文字コードが相違する場合よりも一致度合いが高くなるように重み付けを行い、前記類型決定手段は、一致度合いが基準より高い場合に、この文字画像に基づく画像パターンの登録を禁止し、一致度合いが基準以下である場合に、この文字画像に基づく画像パターンの登録を許可する。
好適には、文字コードは、入力画像に対する文字認識処理により判定されたものであり、前記重み付け手段は、入力された文字画像に対する文字認識処理の認識確度に基づいて、認識確度が高いほど一致度合いが高くなるような重み付けを行う。
また、本発明にかかる画像辞書作成装置は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。
また、本発明にかかる画像辞書作成装置は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、前記文字画像抽出手段により抽出された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段とを有する。
[符号化装置]
また、本発明にかかる符号化装置は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、前記取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する画像パターンの識別情報とを互いに対応付けて符号化する符号化手段とを有する。
また、本発明にかかる符号化装置は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、前記文字画像抽出手段により抽出された文字画像を、複数の文字画像群に分類する文字分類手段と、前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、少なくとも前記領域補正手段により補正されたそれぞれの文字画像の文字領域情報と、この文字画像が分類された文字画像群に基づいて決定された画像パターンの識別情報とを符号化する符号化手段とを有する。
[画像辞書作成方法]
また、本発明にかかる画像辞書作成方法は、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得し、取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する。
[プログラム]
また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得するステップと、取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類するステップと、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。
また、本発明にかかるプログラムは、コンピュータを含む画像辞書作成装置において、入力画像における文字画像それぞれの領域を示す文字領域情報を取得するステップと、取得された文字領域情報に基づいて、入力画像から文字画像を抽出するステップと、抽出された文字画像を、複数の文字画像群に分類するステップと、各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップとを前記画像辞書作成装置のコンピュータに実行させる。
本発明の符号化装置によれば、文字の可読性を保持しつつ、高い圧縮率を実現することができる。
[第1実施形態]
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置2は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等を符号化することにより、高い圧縮率を実現することができる。
図1(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図1(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。
図1(A)に示すように、文字画像を識別情報(文字コード及びフォントの種類)に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、文字画像の識別情報(文字コード及びフォントの種類等)と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを復号化側の画像処理装置に送信することができる。この場合に、復号化側の画像処理装置は、受信した符号データ(文字コード及びフォントの種類)を復号化し、復号化された文字コード及びフォントの種類、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成する。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも更新する必要がある。また、手書き文字等がフォント画像に置換されて再現性が低くなったり、手書き文字が非文字画像として取り扱われて符号量を小さくできないなど、手書き文字等に対する対応が十分でない。
そこで、本実施形態における画像処理装置2は、図1(B)に示すように、復号化側において、入力画像内で類型的に存在する画像パターンをインデクスに対応付けて登録(画像辞書化)し、入力画像に含まれる画像パターンを対応するインデクス及びその出現位置に置換して符号化する。符号化側は、画像パターン及びインデクスが互いに対応付けられた画像辞書と、符号化されたインデクス及び出現位置とを復号化側に送信する。復号化側は、インデクス及び出現位置を復号化し、復号化されたインデクスに対応する画像パターンを画像辞書から選択し、復号化された出現位置に配置する。
このように、画像処理装置2は、入力画像に応じて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。さらには、手書き文字等に対しても十分な再現性を維持しつつ符号量を小さくすることができる。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。
図2(A)は、画像辞書を例示し、図2(B)は、画像パターンを例示する図である。
図2(A)に例示するように、画像辞書には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクスとが含まれる。画像パターンは、入力画像に含まれる部分的な画像データであり、本例では入力画像(2値)中に既定回数以上(複数回)出現する類型的なパターン(2値データ)である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。
次に問題となるのは、どのような基準で入力画像から画像パターンを抽出し、画像辞書として登録するかという点である。抽出される画像パターンの大きさ及び出現頻度によって、入力画像の符号量が異なるからである。例えば、図2(B)に例示するように、文字画像単位で画像パターンが抽出される場合と、文字画像よりもさらに小さな単位で画像パターンが抽出される場合とが考えられる。
文字画像よりもさらに小さな単位で画像パターンが抽出される場合には、それぞれの画像パターンの出現頻度が高い場合が多いが(例えば、「1」の縦棒部分は、「山」及び「川」の一部として出現する)、画像辞書に登録すべき画像パターンの数が多くなり画像辞書のデータ量が大きくなる。
一方、文字画像単位で画像パターンが抽出される場合には、同一ドキュメント内では、同一の言語で同一のフォント種類及び同一のフォントサイズの文字が多数出現するため、画像パターンのサイズが大きい割には高い出現頻度が期待できる。
また、ある程度の非可逆性を許容して高い圧縮率を目指す場合に、符号化側の画像処理装置は、画像パターンと同一の部分画像だけでなく、画像パターンと類似する部分画像もインデクスに置換して符号化する。この場合に、文字画像の部分それぞれが、類似する画像パターンに置換されると、文字画像全体として全く異なるものに復号化されて可読性を失う可能性もある。しかしながら、文字画像単位で画像パターンが抽出される場合には、文字画像の全体的な形状が類似する画像パターン(例えば、数字の「1」とアルファベットの「I」など)に置換されるため、ある程度可読性が維持される。
したがって、本実施形態における画像処理装置2は、文字画像単位で入力画像から画像パターンを抽出し、画像辞書に登録する。
[ハードウェア構成]
次に、画像処理装置2のハードウェア構成を説明する。
図3は、本発明にかかる画像辞書作成方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図3に例示するように、画像処理装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
画像処理装置2は、例えば、符号化プログラム5(後述)がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置22又は記録装置24などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置10に送信する。また、画像処理装置2は、プリンタ装置10のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。
[符号化プログラム]
図4は、制御装置20(図3)により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム5の機能構成を例示する図である。
図4に例示するように、符号化プログラム5は、画像入力部40、画像辞書作成部50及び符号化部60を有する。
符号化プログラム5において、画像入力部40(情報取得手段)は、プリンタ装置10のスキャナ機能により読み取られた画像データ、又は、通信装置22又は記録装置24などを介して取得されたPDL(Page Discription Language)形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部50に出力する。また、画像入力部40は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部410と、PDL形式の画像データを解釈してラスタデータを生成するPDLデコンポーザ420とを有する。
文字認識部410は、入力された画像データ(以下、入力画像)に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部50に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード(ASCIIコード又はシフトJISコードなど)、又は、文字コードとフォントの種類との組合せなどである。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せである。
PDLデコンポーザ420は、PDL形式の画像データを解釈してラスタライズされた画像データ(ラスタデータ)を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報及び文字領域情報を画像辞書作成部50に対して出力する。
画像辞書作成部50は、画像入力部40から入力された入力画像に基づいて、この入力画像の符号化処理に用いられる画像辞書を作成し、作成された画像辞書と入力画像とを符号化部60に対して出力する。より具体的には、画像辞書作成部50は、文字認識部410又はPDLデコンポーザ420から入力された文字識別情報及び文字領域情報に基づいて、入力画像から文字画像単位で画像パターンを抽出し、抽出された画像パターンにインデクスを付与して画像辞書とし符号化部60に出力する。
符号化部60(符号化手段)は、画像辞書作成部50から入力された画像辞書に基づいて入力画像を符号化し、符号化された入力画像と画像辞書とを記録装置24(図3)又はプリンタ装置10(図3)などに出力する。より具体的には、符号化部60は、画像辞書に登録された画像パターンと、入力画像に含まれる部分画像とを比較して、いずれかの画像パターンと一致又は類似する部分画像のデータを、この画像パターンに対応するインデクス及びこの部分画像の位置情報に置換する。さらに、符号化部60は、部分画像と置き換えられたインデクス及び位置情報並びに画像辞書等をエントロピー符号化(ハフマン符号化、算術符号化又はLZ符号化など)により符号化してもよい。
図5は、第1の画像辞書作成部50の機能をより詳細に説明する図である。
図5に示すように、画像辞書作成部50は、記憶部500、文字画像抽出部510、文字分類部520、一致判定部530、辞書決定部540(類型決定手段)、位置補正部550(領域補正手段)及びインデクス付与部560(識別情報付与手段)を有する。記憶部500は、メモリ204(図3)及び記録装置24(図3)を制御して、画像入力部40(図4)から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。
文字画像抽出部510は、文字の位置情報に基づいて、入力画像から文字画像を切り出す。すなわち、文字画像抽出部510は、文字領域情報により示された領域を文字画像として入力画像から抽出する。抽出される文字画像は、文字認識部410により文字画像であると判定された領域である。なお、文字認識部410又はPDLデコンポーザ420が文字画像を入力画像から切り出した状態で画像辞書作成部50に出力してもよい。
文字分類部520は、文字コードに基づいて、入力画像から切り出された文字画像を複数の文字画像群に分類する。例えば、文字分類部520は、文字コードが一致する文字画像を同一の文字画像群に分類する。
一致判定部530は、入力画像から切り出された複数の文字画像を互いに比較して、一致度合いを判定する。ここで、一致度合いとは、複数の画像が互いに一致する程度を示す情報であり、例えば、2値画像が比較される場合に、2つの文字画像を重ねたときの互いに重なりあう画素の数(以下、一致画素数)、この一致画素数を正規化した一致画素率(例えば、一致画素数を全画素数で割ったもの)、又は、複数の文字画像を重ねたときの画素分布(ヒストグラム)などである。
また、一致判定部530は、複数の文字画像を複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部530は、最大の一致度合いを算出するために、複数の文字画像を互いにずらしながら比較する。
例えば、一致判定部530は、同一の文字画像群に分類された2つの文字画像(文字コードが一致する文字画像)を互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部500に出力する。
辞書決定部540は、それぞれの文字画像群に含まれる文字画像に基づいて、画像辞書に登録すべき画像パターンを決定する。すなわち、辞書決定部540は、文字コードが一致する複数の文字画像に基づいて、登録すべき画像パターンを決定する。例えば、辞書決定部540は、文字コードが一致する複数の文字画像(後述する位置補正がなされた文字画像)の和結合パターンを、登録すべき画像パターンとする。なお、和結合パターンとは、複数の画像を互いに重ねあわせた場合の和集合の形状である。
位置補正部550は、一致判定部530から出力されたずらしベクトルに基づいて、文字画像の位置情報を補正する。すなわち、位置補正部550は、画像入力部40から入力された位置情報を、文字コードが一致する複数の文字画像の一致度合いが最大となるように補正する。
インデクス付与部560は、入力画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部500に出力する。
図6は、符号化部60の機能をより詳細に説明する図である。
図6に示すように、符号化部60は、パターン判定部610、位置情報符号化部620、インデクス符号化部630、画像符号化部640、辞書符号化部650、選択部660及び符号出力部670を有する。
パターン判定部610は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン(同一又は類似の画像パターン)を判定する。より具体的には、パターン判定部610は、入力画像から文字画像単位で切り出された部分画像(位置補正部550により補正がなされたもの)と、画像パターンとを重ねあわせて、一致判定部530(図5)と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部610は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部620に対して出力し、この画像パターンのインデクスをインデクス符号化部630に対して出力し、対応する画像パターンが発見されない場合には、この部分画像を画像符号化部640に対して出力する。
位置情報符号化部620は、パターン判定部610から入力された位置情報(すなわち、位置補正部550により補正された部分画像(文字画像)の位置情報)を符号化し、選択部660に対して出力する。例えば、位置情報符号化部620は、LZ符号化又は算術符号化等を適用して、位置情報を符号化する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、選択部660に対して出力する。例えば、インデクス符号化部630は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部640は、画像に適した符号化方式を適用して、パターン判定部610から入力された部分画像を符号化し、選択部660に対して出力する。
辞書符号化部650は、画像辞書作成部50(図4,図5)から入力された画像辞書(画像パターンとインデクスとが互いに対応付けられたもの)を符号化し、符号出力部670に対して出力する。
選択部660は、パターン判定部610により部分画像に対応する画像パターンが発見された場合に、位置情報符号化部620から入力された位置情報の符号データと、インデクス符号化部630から入力されたインデクスの符号データとを互いに対応付けて符号出力部670に対して出力し、パターン判定部610により部分画像に対応する画像パターンが発見されなかった場合に、画像符号化部640により符号化された部分画像の符号データを符号出力部670に対して出力する。
符号出力部670は、選択部660から入力された符号データ(位置情報、インデクス及び部分画像の符号データ)と、辞書符号化部650から入力された符号データ(画像辞書の符号データ)とを互いに対応付けてプリンタ装置10(図3)、記録装置24(図3)又は通信装置22(図3)に出力する。
[符号化動作]
次に、画像処理装置2による符号化処理の全体動作を説明する。
図7は、符号化プログラム5の第1の動作(S1)を示すフローチャートである。なお、本フローチャートでは、プリンタ装置10のスキャナ機能により光学的に読み取られた2値の画像データが入力される場合を具体例として説明する。
図7に示すように、ステップ10(S10)において、画像入力部40は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を判定し、判定された文字コード及び位置情報を画像辞書作成部50に対して出力する。
ステップ20(S20)において、画像辞書作成部50の記憶部500は、画像入力部40から入力された入力画像、文字コード及び位置情報をメモリ204(図3)に記憶する。
文字画像抽出部510は、記憶部500により記憶された位置情報に基づいて、入力画像における文字画像の範囲を特定し、特定された範囲から文字画像を切り出して記憶部500に記憶する。なお、文字画像の切出しは、符号化対象となる全入力画像(例えば、1ページ又は1ドキュメント)についてなされる。
ステップ30(S30)において、文字分類部520は、文字画像抽出部510により抽出された文字画像を、文字認識部410(図4)から入力された文字コード毎に分類する。
ステップ40(S40)において、一致判定部530、辞書決定部540及び位置補正部550は、協働して、文字分類部520により分類された文字画像に基づいて画像辞書に登録する画像パターンを決定し、決定された画像パターンを画像辞書として記憶部500に格納する。
ステップ50(S50)において、インデクス付与部560は、決定された画像パターンに対してインデクスを付与し、付与されたインデクスを画像パターンに対応付けて記憶部500に格納する。付与されるインデクスは、少なくとも、符号化対象として入力された全入力画像について、それぞれの画像パターンを一意に識別するものである。
画像パターンの決定及びインデクスの付与が符号化対象として入力された全入力画像について終了すると、これらの画像パターン及びインデクスは、画像辞書として符号化部60に出力される。
ステップ60(S60)において、符号化部60は、画像辞書に登録された画像パターンと、入力画像に含まれる部分画像とを比較して、画像パターンと一致する部分画像が存在する場合に、この部分画像をインデクス及び位置情報に置換して符号化し、画像パターンと一致しない部分画像をそのまま符号化する。また、符号化部60は、画像辞書を符号化する。
ステップ70(S70)において、符号化部60は、インデクス、位置情報及び部分画像の符号データと、画像辞書の符号データとをプリンタ装置10等に出力する。
図8は、第1の画像パターン決定処理(S40)をより詳細に説明するフローチャートである。
図8に示すように、ステップ402(S402)において、一致判定部530は、文字コード毎に分類された文字画像を互いに比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部530は、文字画像群における黒画素の画素分布(ヒストグラム)を作成し、作成された画素分布と、この文字画像群に含まれる文字画像とを互いにずらしながら黒画素の一致画素数を算出する。なお、画素分布は、文字画像群に属する文字画像の黒画素を一致画素数が最大となる相対位置で領域毎に画素値を順次加算したヒストグラムである。
すなわち、文字画像群の画素分布をQ(x)、各文字画像の画素値をP(i,x)、位置ベクトルをx、文字画像群に属する各文字画像をi(1〜N:Nは文字画像群に属する文字画像の数)、文字画像iのずらしベクトルをviとした場合に、一致判定部530は、以下の数式により一致画素数を算出する。
(一致画素数K)=Σ{Q(x)*P(i,x−vi)}(「Σ」は、変数xについての総和を示す)
なお、i=1の場合には、
Q(x)=P(1,x)
となり、
i>1の場合には、
Q(x)=P(1,x)+P(2,x−v2)+・・・+P(i−1,x−v(i−1))
となる。
ステップ404(S404)において、位置補正部550は、一致判定部530により複数の相対位置で算出される一致画素数(一致度合い)に基づいて、文字認識部410から入力された位置情報の補正ベクトルを決定する。具体的には、位置補正部550は、一致判定部530により算出される一致画素数Kが最大となったときのずらしベクトルvi(文字認識部410から入力された位置情報を基準として文字画像を変位させた2次元ベクトル)を補正ベクトルとする。
ステップ406(S406)において、一致判定部530は、同一の文字画像群に分類された複数の文字画像(補正ベクトルにより位置が補正されたもの)を比較して、各領域における画素値の一致度合いを算出する。具体的には、一致判定部530は、一致画素数が最大となる相対位置でこの文字画像群に含まれる全文字画像を重ねあわせ、それぞれの領域の黒画素を加算して画素分布(ヒストグラム)を作成する。すなわち、一致判定部530は、以下の数式により、それぞれの文字画像群に含まれる全文字画像(1〜N)についてQ(x)を算出する。
Q(x)=ΣP(i,x−vi)
ステップ408(S408)において、辞書決定部540は、一致判定部530により算出された一致度合い(画素分布)に対して、閾値以下の分布数を除去する閾値処理を行う。具体的には、辞書決定部540は、一致判定部530により算出されたQ(x)を正規化してQ’(x)を算出し、算出されたQ’(x)に対して閾値処理を行う。すなわち、辞書決定部540は、以下の数式により分布確率Q’(x)を算出する。
Q’(x)=Q(x)/N
次に、一致判定部530は、以下の条件式により、分布確率Q’(x)が基準値よりも小さい部分を除去してQ”(x)を算出する。
Q’(x)>閾値Aの場合に、Q”(x)=1
上記以外の場合に、Q”(x)=0
ステップ410(S410)において、辞書決定部540は、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上ある場合に、S412の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理(S40)を終了する。
具体的には、辞書決定部540は、上記Q”(x)が1となる画素の数が基準値以上であるか否かを判定し、基準値以上である場合に、画像パターンの登録を行い、基準値よりも小さい場合に、画像パターンの登録を行わない。
ステップ412(S412)において、辞書決定部540は、画素分布に基づいて、画像パターンを決定する。具体的には、辞書決定部540は、Q”(x)のパターンを画像辞書に登録する画像パターンに決定する。
図9は、符号化処理(S60)をより詳細に説明するフローチャートである。なお、本フローチャートでは、図8で決定された画像パターンに基づいて符号化処理を行う場合を具体例として説明する。
図9に示すように、ステップ602(S602)において、パターン判定部610は、補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された画像パターンとを比較して、一致画素数を算出する。なお、パターン判定部610は、一致判定部530から一致画素数を取得してもよい。
ステップ604(S604)において、パターン判定部610は、一致する画像パターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの画像パターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S606の処理に移行し、許容範囲外である場合に、S610の処理に移行する。
ステップ606(S606)において、パターン判定部610は、一致画素数が許容範囲内である画像パターンのうち、一致画素数が最大の画像パターンのインデクスを画像辞書から読み出し、読み出されたインデクスをインデクス符号化部630に対して出力し、この文字画像の位置情報(位置補正部550により補正されたもの)を位置情報符号化部620に対して出力する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、インデクスの符号データを選択部660に対して出力する。
ステップ608(S608)において、位置情報符号化部620は、パターン判定部610から入力された位置情報を符号化し、位置情報の符号データを選択部660に対して出力する。
選択部660は、インデクス符号化部630から入力されたインデクスの符号データと、位置情報符号化部620から入力された位置情報の符号データとを互いに対応付けて符号出力部670に対して出力する。すなわち、選択部660は、部分画像毎に、インデクスと位置情報とを互いに対応付けられるように符号出力部670に出力する。
ステップ610(S610)において、パターン判定部610は、この部分画像(すなわち、対応する画像パターンが画像辞書に存在しなかった文字画像)を画像符号化部640に対して出力する。
画像符号化部640は、パターン判定部610から入力された部分画像の画像データを符号化し、部分画像の符号データを選択部660に対して出力する。
選択部660は、画像符号化部640から入力された部分画像の符号データを符号出力部670に対して出力する。
ステップ612(S612)において、パターン判定部610は、全ての部分画像について符号化処理が終了したか否かを判定し、符号化していない部分画像が存在する場合に、S602の処理に戻って、次の部分画像の符号化処理を行い、全ての部分画像が符号化された場合に、S614の処理に移行する。
ステップ614(S614)において、辞書符号化部650は、画像辞書作成部50から入力された画像辞書(画像パターンとインデクスとを対応付けたもの)を符号化し、画像辞書の符号データを符号出力部670に対して出力する。
以上説明したように、本実施形態における画像処理装置2は、文字コードに基づいて分類された文字画像群それぞれに基づいて画像パターンを決定し画像辞書に登録するため、文書画像の可読性を維持しつつ効率的な符号化(高い圧縮率の符号化)を実現する。
また、本画像処理装置2は、同一の文字画像群に属する文字画像を互いに比較して文字画像の切出し位置(文字画像の位置情報)を補正するため、文字画像の切出し誤差又はフォントの違い等により発生する文字画像のずれを修正し、文字の配置を高い精度で再現することができる。なお、本実施形態では、画像処理装置2は、文字コードに基づいて文字画像を文字画像群に分類したが、フォントの種類及び文字画像の大きさ等の他の文字識別情報を用いて文字画像を分類してもよいし、文字コード、フォントの種類及び文字画像の大きさのいずれか2つ以上を組み合わせて文字画像を分類してもよい。
[変形例1]
次に、上記実施形態の第1の変形例を説明する。
図10は、文字認識処理により同一の文字コードとして判定されうる文字画像を例示する図である。
図10(A)に例示するように、フォントの種類が異なる数字「1」は、文字認識部410によって、同一の文字コードとして判別されうる。したがって、上記実施形態では、これらフォントの異なる複数の数字「1」は同一の文字画像群に分類され、これらの文字画像に基づいて1つの画像パターンが登録される。しかしながら、これらの数字「1」は、互いに異なる形状を有し、復号化後の画像においてもこれら形状の相違を再現したい場合がある。また、大きさのみが異なる文字も同一の文字コードとして判別されうるが、これら大きさの相違も再現したい場合がある。
また、図10(B)に例示するように、文字認識処理のミスにより、形状が類似する文字(例えば、数字「1」とアルファベット大文字「I」と)が同一の文字コードとして判別されうる。この場合、少なくとも形状が近似しているため、可読性に与える影響はそれほど大きくないが、これらを区別できるように再現したい場合もある。
そこで、第1の変形例における画像処理装置2は、文字コード毎に分類された文字画像群に、形状の異なる文字画像が混在している場合に、この文字画像群について2以上の画像パターンを決定し、それぞれの画像パターンを画像辞書に登録できるようにする。
図11は、第2の画像パターン決定処理(S42)のフローチャートである。なお、本図における各処理のうち、図8に示された処理と実質的に同一のものには同一の符号が付されている。
図11に示すように、S410において、辞書決定部540が、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上ある場合に、S422の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理(S42)を終了する。
ステップ422(S422)において、辞書決定部540は、画素分布に基づいて、和結合パターンQ”(x)を決定する。
ステップ424(S424)において、辞書決定部540は、和結合パターンQ”(x)と、この文字画像群に属する文字画像との共通部分(積集合)を共通パターンとして抽出し、抽出された共通パターンを画像パターンに決定する。なお、辞書決定部540は、それぞれの文字画像に基づいて抽出された共通パターンすべてを画像辞書に登録するわけではなく、重複する共通パターンを排除して画像辞書に登録する。また、辞書決定部540は、それぞれの文字画像に基づいて抽出された複数の共通パターンのうち、黒画素の領域の違いが閾値以下である場合にも、重複するものとして排除してもよい。
図12は、第1の変形例における画像パターンの決定方法を模式的に説明する図である。
図12に示すように、文字コードで分類された文字画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。これは、文字画像群の中に、形状が異なる文字画像が混在しているからである。分布確率Q’(x)は、閾値Bにより閾値処理がなされることにより、分布確率が低い部分を除去される。これにより、出現頻度が低い文字の差分形状(出現頻度の高い文字との差分)及びノイズ部分等を排除して、類型的な形状のみを画像パターンとすることができる。
辞書決定部540は、上記S422において、閾値B以上の部分を1とし、閾値Bよりも小さい部分を0とした和結合パターンQ”(x)を生成する。
次に、辞書決定部540は、S424において、和結合パターンQ”(x)と、文字画像群に属する各文字画像との共通部分を共通パターンとして抽出する。すなわち、辞書決定部540は、和結合パターンQ”(x)と、各文字画像の画素分布P(i,x−vi)とを積演算する。これにより、文字画像群の中に複数存在する類型的な文字画像の画像パターン#1及び画像パターン#2が抽出される。
以上説明したように、第1の変形例における画像処理装置2は、同一の文字コードにより分類された複数の文字画像に基づいて、類型的な複数の画像パターンを決定することができる。これにより、出現頻度が高ければ、フォント又は大きさ等が異なる文字画像もそれぞれ画像パターンとして画像辞書に登録され、復号化された画像においてこれらの文字画像がそれぞれ再現されることになる。
[変形例2]
次に、上記実施形態の第2の変形例を説明する。
図13は、同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。
図13(A)に例示するように、フォントの種類が異なる数字「1」は、文字認識部410によって、同一の文字コードとして判別されうる。このように、文字コードによって分類された文字画像群は、大部分で同一の形状を有している。以下、文字画像群に属する複数の文字画像が共通して有する部分画像を共通形状といい、それぞれの文字画像とこの共通形状との差分となる部分画像を差分形状という。
図13(B)に例示するように、これらの文字画像を構成する部分形状のうち、第1レベルパターンは、これらの文字画像の共通形状であるため出現頻度が特に高い。また、第2レベルパターンa及び第2レベルパターンbは、それぞれの文字画像に固有の部分形状であり、第1レベルパターンに比べると出現頻度が低い。
そこで、第2の変形例における画像処理装置2は、文字コード毎に分類された文字画像群に形状の異なる複数の文字画像が混在している場合に、これらの文字画像の共通形状及び差分形状をそれぞれ画像パターンとして画像辞書に階層的に登録する。
図14は、第3の画像パターン決定処理(S44)のフローチャートである。なお、本図における各処理のうち、図8に示された処理と実質的に同一のものには同一の符号が付されている。
図14に示すように、S410において、辞書決定部540が、閾値処理後の画素分布について、分布数が0でない領域(黒画素の領域)が基準よりも広いか否かを判定し、基準以上ある場合に、S442の処理に移行し、基準よりも狭い場合に、この文字画像群について画像パターンの登録を行わずに、画像パターン決定処理(S44)を終了する。
ステップ442(S442)において、辞書決定部540は、分布確率Q’(x)において第1レベル閾値よりも大きな部分を共通形状の画像パターン(すなわち、第1レベルパターン)として抽出する。ここで、第1レベル閾値とは、文字画像群に属する文字画像が共通して有する共通形状と、他の形状とを分離するための基準であり、本例では、文字画像群に属するほぼ全ての文字画像で黒画素が存在する場合の分布確率(0.95など)である。
ステップ444(S444)において、辞書決定部540は、分布確率Q’(x)から第1レベルパターンに相当する部分を0にして、第1レベルパターンに相当する部分が除去された分布確率Q1(x)を生成する。
次に、辞書決定部540は、この分布確率Q1(x)において第2レベル閾値以上の部分を1、第2レベル閾値より小さい部分を0として、第1レベルパターンが除去された和結合パターンQ1”(x)を生成する。ここで、第2レベル閾値とは、共通形状の差分としてそれぞれの文字画像を構成する差分形状であって文字画像群において出現頻度が高いものを分離するための基準であり、第1レベル閾値よりも低く、例えば、目標となる符号量及び画質に応じて設定される。
そして、辞書決定部540は、この和結合パターンQ1”と、各文字画像の画素分布P(i,x−vi)とを積演算して、これらの共通部分であるRi(x)を抽出し、抽出されたRi(x)を差分形状の画像パターン(すなわち、第2レベルパターン)に決定する。
ステップ446(S446)において、辞書決定部540は、同一の文字画像群から生成された第1レベルパターン及び第2レベルパターンを互いに対応付けて画像辞書に登録する。より具体的には、辞書決定部540は、第1レベルパターン及び第2レベルパターンをそれぞれのインデクスにより階層的に対応付けて画像辞書に登録する。
図15は、第2の変形例における画像パターンの決定方法を模式的に説明する図である。
図15に示すように、文字コードで分類された文字画像の黒画素の分布確率Q’(x)は、画素位置xによって異なる数値を示す。このうち、分布確率が最も高い部分は、この文字画像群に属する文字画像に共通する形状(すなわち、共通形状)であると考えられる。そして、分布確率が存在する他の領域は、それぞれの文字画像と共通形状との差分に相当する形状(すなわち、差分形状)であると考えられる。
そこで、辞書決定部540は、共通形状(分布確率がほぼ最大となる領域)を抽出するための第1レベル閾値と、出現頻度の高い差分形状を抽出するための第2レベル閾値とを有している。
まず、辞書決定部540は、分布確率Q’(x)に対して第1レベル閾値により閾値処理を行い、第1レベルパターン(共通形状)に相当する部分を抽出する。次に、分布確率Q’(x)から、抽出された第1レベルパターンに相当する部分が除去されて、第2レベル閾値を基準として「1」又は「0」に変換されることにより、第2レベル和結合パターンQ1”(x)が生成される。
辞書決定部540は、この第2レベル和結合パターンQ1”(x)と、各文字画像iの画素分布P(i,x)とを積演算することにより、これらの共通部分である第2レベルパターンを抽出する。本例では、第2レベル和結合パターンQ1”(x)と「文字画像#1」との共通部分は、第2レベルパターンaとなり、第2レベル和結合パターンQ1”(x)と「文字画像#2」との共通部分は、第2レベルパターンbとなる。
これにより、「文字画像#1」は、第1レベルパターンと、第2レベルパターンaとの和としてそれぞれのインデクスに置換でき、「文字画像#2」は、第1レベルパターンと、第2レベルパターンbとの和としてインデクスに置換できる。
図16は、第2の変形例における符号化処理(S64)のフローチャートである。なお、本図における各処理のうち、図9に示された処理と実質的に同一のものには同一の符号が付されている。
図16に示すように、S602において、パターン判定部610は、補正後の位置情報に基づいて入力画像から切り出された部分画像(すなわち、文字画像)と、画像辞書に登録された第1レベルパターンとを比較して、一致画素数を算出する。
ステップ642(S642)において、パターン判定部610は、入力された部分画像と一致する第1レベルパターンが存在するか否かを判定する。具体的には、パターン判定部610は、それぞれの第1レベルパターンについて算出された一致画素数が許容範囲(例えば、部分画像の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S644の処理に移行し、許容範囲外である場合に、S610の処理に移行する。
ステップ644(S644)において、パターン判定部610は、一致画素数が許容範囲内である第1レベルパターンのうち、一致画素数が最大の第1レベルパターンのインデクスを画像辞書から読み出し、読み出されたインデクスをインデクス符号化部630に対して出力し、この文字画像の位置情報(位置補正部550により補正されたもの)を位置情報符号化部620に対して出力する。
ステップ646(S646)において、パターン判定部610は、この第1レベルパターンの形状と、入力された部分画像との差分形状を抽出する。
ステップ648(S648)において、パターン判定部610は、この第1レベルパターンと対応付けられている第2レベルパターンを画像辞書から読み出し、読み出された第2レベルパターンと、抽出された差分形状とを比較して一致画素数を算出する。パターン判定部610は、それぞれの第2レベルパターンについて算出された一致画素数が許容範囲(例えば、差分形状の全画素に対して90%以上)内であるか否かを判定し、許容範囲内である場合に、S650の処理に移行し、許容範囲外である場合に、S608の処理に移行する。
ステップ650(S650)において、パターン判定部610は、一致画素数が許容範囲内である第2レベルパターンのうち、一致画素数が最大の第2レベルパターンのインデクスを画像辞書から読み出し、読み出されたインデクスを、上記第1レベルパターンのインデクスと対応付けてインデクス符号化部630に対して出力する。
なお、本例では、第1レベルパターン及び第2レベルパターンのいずれとも一致しない黒画素をノイズ等として除去しているが、これらの黒画素そのものを別途符号化してもよい。
以上説明したように、第2の変形例における画像処理装置2は、同一の文字コードにより分類された複数の文字画像を互いに比較して、共通形状と差分形状とを抽出し、抽出された共通形状及び差分形状を階層的に対応付けて画像辞書に登録する。これにより、高い圧縮率を実現しつつ、文字画像の再現性を高めることができる。
また、画像処理装置2は、共通形状と差分形状とを階層化し、共通形状の符号データから順に出力することにより、復号化側で復号化した符号データの量に応じて徐々に画像品質を改善するプログレッシブ伝送を実現することができる。
[変形例3]
次に、上記実施形態の第3の変形例を説明する。
文字認識部410による文字認識の正確性(確度)は、入力画像に含まれる文字画像毎に異なる場合がある。したがって、文字認識結果(文字コード)に基づいて分類された文字画像群には、形状の類似しない文字画像が混在する可能性がある。このように形状が類似しない文字画像が文字画像群に混在すると、画像辞書に登録される画像パターンが歪めらるなどの弊害が発生しうる。
そこで、第3の変形例における画像処理装置2は、文字認識処理の確度毎に、画像辞書を作成する。
図17は、文字認識処理の確度毎に作成された画像辞書を例示する図である。
図17に例示するように、第3の変形例における文字分類部520は、文字認識処理の確度を文字認識部410から取得し、取得された確度に応じて、入力画像に含まれる文字画像を分類する。本例の文字分類部520は、「確度が90%以上」の文字画像群、「確度が70%以上90%未満」の文字画像群、及び、「確度が70%未満」の文字画像群というように、確度の範囲によって文字画像を分類している。
さらに、文字分類部520は、それぞれの文字画像群を文字コードでさらに分類する。
一致判定部530は、確度及び文字コードにより分類された文字画像群それぞれについて、これらの文字画像群に含まれる文字画像を互いに比較して一致度合いを判定する。辞書決定部540は、確度及び文字コードにより分類された文字画像群それぞれについて、画像パターンを決定する。なお、辞書決定部540は、確度が低い文字画像群について画像パターンを決定する場合には、まず、確度が高い文字画像群について決定された画像パターンと、この文字画像群(確度が低い文字画像群)に属する各文字画像とを比較して、一致するか否かを判定し、一致する場合には、この文字画像を文字画像群から排除する。
以上説明したように、第3の変形例における画像処理装置2は、文字認識処理の確度毎に画像辞書を作成することにより、文字認識処理のミスによる画像辞書への影響を最小限に抑えることができる。
[第2実施形態]
次に、第2の実施形態を説明する。
上記第1の実施形態では、画像辞書作成部50は、1ページ又は1ドキュメントなどの文字画像全部を用いて画像辞書を作成していたが、本実施形態における第2の画像辞書作成部52は、1文字ずつ文字画像を比較して画像辞書に登録する。
図18は、第2の画像辞書作成部52の機能構成を説明する図である。
図18に示すように、第2の実施形態における画像辞書作成部52は、図5に示した第1の画像辞書作成部50の各構成に加えて、登録制御部570を有する。
登録制御部570は、文字画像抽出部510により抽出された文字画像を画像パターンとして画像辞書に登録するか否かを判断し、画像辞書への新規登録を制御する。より具体的には、登録制御部570は、新規に入力された文字画像と画像辞書に登録された画像パターンとの一致度合いに基づいて、新規に入力された文字画像を画像パターンとして画像辞書に登録するか否かを判断する。例えば、登録制御部570は、既登録の画像パターンと、新たに入力された文字画像との一致度合いがいずれも基準以下である場合に、この文字画像を画像パターンとして画像辞書に登録するよう辞書決定部540に指示する。
図19は、第2の実施形態における符号化プログラム5の第2の動作(S2)を示すフローチャートである。なお、本フローチャートでは、文字認識部410(図4)が、1文字ずつ、入力画像に含まれる文字画像の位置及びその文字コードを判定しそれぞれの文字画像(2値)を1文字ずつ切り出す場合を具体例として説明する。また、本図に示す各処理のうち、図7に示された処理と実質的に同一のものには同一の符号が付されている。
図19に示すように、S10において、画像入力部40は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を1文字ずつ判定し、判定された文字コード、位置情報及び文字画像(2値)を1文字ずつ画像辞書作成部50に対して出力する。
ステップ22(S22)において、画像辞書作成部50の記憶部500は、画像入力部40から1文字ずつ入力される文字画像、文字コード及び位置情報をメモリ204(図3)に記憶する。なお、画像入力部40から、切り出された文字画像ではなく、入力画像全体が入力される場合には、文字画像抽出部510が、1文字分ずつ入力される文字コード及び位置情報に基づいて、入力画像から文字画像を1文字分ずつ切り出して記憶部500に対して出力する。
ステップ46(S46)において、登録制御部570は、一致判定部530及び位置補正部550と協働して、新たに入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
ステップ52(S52)において、登録制御部570は、入力された文字画像を画像パターンとして画像辞書に登録すると判定した場合に、S54の処理に移行し、入力された文字画像を画像パターンとして登録しないと判定した場合に、S62の処理に移行する。なお、登録しないと判定された文字画像の位置情報は、この文字画像と最も近似する画像パターンのインデクスと対応付けられて符号化部60に対して出力される。
ステップ54(S54)において、インデクス付与部560は、新たに入力された文字画像(画像パターンとして登録されるもの)に対してインデクスを付与し、この文字画像及びインデクスを記憶部500に対して出力し、この文字画像の位置情報及びインデクスを符号化部60に対して出力する。
ステップ62(S62)において、符号化部60は、画像辞書作成部52(図18)から1文字分ずつ入力されるインデクス及び位置情報を符号化し、プリンタ装置10等に出力する。
ステップ80(S80)において、符号化プログラム5は、入力画像に含まれる文字画像全てについて処理が終了したか否かを判定し、終了したと判定された場合に、画像辞書を符号化してプリンタO装置10等に出力して動作(S2)を終了し、終了していないと判定された場合に、S22の処理に戻って、次の文字画像について処理を行う。
図20は、第2の実施形態における画像パターン登録判定処理(S46)をより詳細に説明するフローチャートである。なお、本図における各処理のうち、図8に示された処理と実質的に同一のものには同一の符号が付されている。
図20に示すように、ステップ462(S462)において、一致判定部530は、新たに入力された文字画像と、記憶部500により画像辞書として記憶されている画像パターンとを比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部530は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素数Kを算出する。
一致画素数Kは、以下の数式により算出される。
(一致画素数K)=Σ{S(x)*P(i,x−vi)}
S(x):画像パターンの画素分布
次に、一致判定部530は、算出された一致画素数Kを正規化して、一致画素率K’を算出する。
一致画素率K’は、以下の数式により算出される。
(一致画素率K’)=K/M
M:文字画像を構成する画素数
S404において、位置補正部550は、一致判定部530により複数の相対位置で算出される一致度合いに基づいて、文字認識部410から入力された位置情報の補正ベクトルを決定する。具体的には、位置補正部550は、一致判定部530により算出される一致画素率K’が最大となったときのずらしベクトルviを補正ベクトルとする。
ステップ464(S464)において、登録制御部570は、一致判定部530により判定された一致画素率K’と、画像パターンの登録/非登録を決定するための基準値とを比較し、一致画素率K’が基準値以上である場合に、S466の処理に移行し、一致画素率K’が基準値よりも小さい場合に、S470の処理に移行する。
ステップ466(S466)において、登録制御部570は、この文字画像の画像辞書への登録を禁止する。さらに、登録制御部570は、この文字画像と最も近似する画像パターン(すなわち、一致画素率K’が最大の画像パターン)のインデクスを画像辞書から読み出す。
ステップ467(S467)において、登録制御部570は、読み出されたインデクスと、この文字画像の位置情報(位置補正部550により補正がなされたもの)とを符号化部60に対して出力する。
ステップ470(S470)において、登録制御部570は、辞書決定部540に対して、新たに入力された文字画像を画像パターンとして画像辞書に登録するよう指示する。
辞書決定部540は、入力された文字画像(位置補正部550により位置補正がなされたもの)を画像パターンとして記憶部500(画像パターン記憶手段)に登録する。
以上説明したように、第2の実施形態における画像処理装置2は、文字画像の位置情報に基づいて文字画像を1文字ずつ切り出し、切り出された文字画像を1文字ずつ画像辞書に登録するか否かを判定し、判定結果に基づいて符号化する。これにより、逐次的に符号化処理を行うことができる。
[変形例]
次に、第2の実施形態の変形例を説明する。
画像辞書作成部52は、画像パターンとして画像辞書に登録された文字画像を文字コードに対応付けて記憶し、新たに入力された文字画像と、文字コードが一致する画像パターンとを優先的に比較して、一致度合いを判定する。例えば、辞書決定部540は、文字画像を画像パターンとして画像辞書に登録する場合に、この文字画像の文字コードを画像パターンに対応付けて登録する。一致判定部530は、新たに入力された文字画像と文字コードが一致する画像パターンのみを画像辞書から読み出し、読み出された画像パターンと、入力された文字画像とを比較して、一致画素率K’を算出する。登録制御部570は、文字コードが一致する画像パターンと入力された文字画像との一致画素率K’のみに基づいて、入力された文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
これにより、画像辞書作成部52は、一致度合いの判定処理の回数を減らすことができる。
また、画像辞書作成部52は、入力される文字画像の文字コードに基づいて、判定される一致度合いに重み付けを行ってもよい。また、画像辞書作成部52は、文字認識部410による文字認識処理の確度に基づいて、判定される一致度合いに重み付けを行ってもよい。
図21(A)は、文字コードに基づく重み付け処理の重み付け係数を例示し、図21(B)は、文字認識処理の確度に基づく重み付け処理の重み付け係数を例示する図である。
図21(A)に例示するように、登録制御部570(重み付け手段)は、入力された文字画像の文字コードと画像パターンの文字コードとが一致するか否かに応じて、異なる重み付け係数を有し、一致判定部530により判定された一致度合い(例えば、一致画素率K’)に対して重み付けを行う。より具体的には、登録制御部570は、入力された文字画像の文字コードと画像パターンの文字コードとが一致する場合に、これらの文字コードが一致しない場合よりも一致画素率K’が大きくなるように重み付けを行う。すなわち、画像辞書作成部52は、文字コードが一致する場合には文字画像が文字として画像パターンと同一であると推定されるため、画像としても一致又は近似するものと判定されるように一致度合いを加重する。
なお、文字コードに応じた重み付け処理は、文字コードの一致/不一致によるものに限定されるものではなく、例えば、特定の文字コードの組合せ(数字「1」とアルファベット「l」のように形状が類似する組合せなど)に対応する重み付け係数を設定し、文字コードの組合せに応じてなされてもよいし、可読性の要求に応じた重み付け係数(例えば、漢字の文字コードとひらがなの文字コードとで異なる重み付け)を設定してなされてもよい。
また、図21(B)に例示するように、登録制御部570(重み付け手段)は、入力された文字画像の文字認識処理の確度に応じて、異なる重み付け係数を有し、一致判定部530により判定された一致度合い(例えば、一致画素率K’)に対して重み付けを行う。より具体的には、登録制御部570は、文字認識処理の確度が高いほど、一致画素率K’が大きくなるように重み付けを行う。すなわち、画像辞書作成部52は、文字認識処理の確度が低い場合に文字画像の切出し位置等も正確でない場合があるため、画像パターンと一致又は近似するものとして判定されるための基準を高くするよう重み付けを行う。また、登録制御部570は、文字コードの一致/不一致に基づく重み付け処理がなされることを前提とした場合に、文字認識処理の確度に応じて重み付けを行うことは好適である。
図22は、本変形例における画像辞書作成部52の動作(S48)を説明するフローチャートである。なお、本図における各処理のうち、図20に示された処理と実質的に同一のものには同一の符号が付されている。
図22に示すように、S462及びS404において、一致判定部530は、画像辞書に登録されている画像パターンそれぞれと、新たに入力された文字画像とを互いにずらしながら黒画素の一致画素率K’を算出し、位置補正部550は、一致判定部530により算出される一致画素率K’に基づいて、補正ベクトルを算出する。
ステップ482(S482)において、登録制御部570は、文字コードが一致しているか否かに応じて、それぞれの画像パターンについて算出された一致画素率K’に重み付け係数を掛け合わせる。
さらに、登録制御部570は、この文字画像に対する文字認識処理の確度を文字認識部410から取得し、取得された文字認識処理の確度に応じて、一致画素率K’に重み付け係数をかけ合わせる。
S464において、登録制御部570は、文字コードの一致/不一致、及び、文字認識処理の確度に基づいて重み付けがなされた一致画素率K’と、基準値とを比較して、この文字画像を画像パターンとして画像辞書に登録するか否かを判定する。
このように、画像辞書作成部52は、文字コードの一致/不一致及び文字認識処理の確度に基づいて、判定された一致度合いに重み付けを行うことにより、画像辞書により適切な画像パターンを登録することができる。
(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。 (A)は、画像辞書を例示し、(B)は、画像パターンを例示する図である。 本発明にかかる画像辞書作成方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。 制御装置21(図3)により実行され、本発明にかかる画像辞書作成方法を実現する符号化プログラム5の機能構成を例示する図である。 第1の画像辞書作成部50の機能をより詳細に説明する図である。 符号化部60の機能をより詳細に説明する図である。 符号化プログラム5の第1の動作(S1)を示すフローチャートである。 第1の画像パターン決定処理(S40)をより詳細に説明するフローチャートである。 符号化処理(S60)をより詳細に説明するフローチャートである。 文字認識処理により同一の文字コードとして判定されうる文字画像を例示する図である。 第2の画像パターン決定処理(S42)のフローチャートである。 第1の変形例における画像パターンの決定方法を模式的に説明する図である。 同一の文字コードとして判定されうる複数の文字画像の共通形状及び差分形状を例示する図である。 第3の画像パターン決定処理(S44)のフローチャートである。 第2の変形例における画像パターンの決定方法を模式的に説明する図である。 第2の変形例における符号化処理(S64)のフローチャートである。 文字認識処理の確度毎に作成された画像辞書を例示する図である。 第2の画像辞書作成部52の機能構成を説明する図である。 第2の実施形態における符号化プログラム5の第2の動作(S2)を示すフローチャートである。 第2の実施形態における画像パターン登録判定処理(S46)をより詳細に説明するフローチャートである。 (A)は、文字コードに基づく重み付け処理の重み付け係数を例示し、(B)は、文字認識処理の確度に基づく重み付け処理の重み付け係数を例示する図である。 本変形例における画像辞書作成部52の動作(S48)を説明するフローチャートである。
符号の説明
2・・・画像処理装置
5・・・符号化プログラム
40・・・画像入力部
410・・・文字認識部
420・・・PDLデコンポーザ
50,52・・・画像辞書作成部
500・・・記憶部
510・・・文字画像抽出部
520・・・文字分類部
530・・・一致判定部
540・・・辞書決定部
550・・・位置補正部
560・・・インデクス付与部
570・・・登録制御部
60・・・符号化部
610・・・パターン判定部
620・・・位置情報符号化部
630・・・インデクス符号化部
640・・・画像符号化部
650・・・辞書符号化部
660・・・選択部
670・・・符号出力部

Claims (19)

  1. 入力画像に対する文字認識処理の結果を取得する情報取得手段と、
    前記情報取得手段により取得された文字認識処理の結果に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
    前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
    を有する画像辞書作成装置。
  2. 前記情報取得手段は、文字認識処理の結果として、それぞれの文字画像が表す文字を識別する文字識別情報を取得し、
    前記文字分類手段は、前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する
    請求項1に記載の画像辞書作成装置。
  3. 文字識別情報には文字コードが含まれており、
    前記文字分類手段は、入力画像に含まれる文字画像を文字コード毎に分類し、
    前記類型決定手段は、同一の文字コードに分類された文字画像に基づいて、これらの文字画像に対応する画像パターンを決定する
    請求項2に記載の画像辞書作成装置。
  4. 前記情報取得手段は、入力画像における文字画像それぞれの領域を示す文字領域情報を取得し、
    前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段
    をさらに有し、
    前記文字分類手段は、前記文字画像抽出手段により抽出された文字画像を複数の文字画像群に分類し、
    前記類型決定手段は、前記文字画像抽出手段により抽出された文字画像を互いに比較して、画像パターンを決定する
    請求項1に記載の画像辞書作成装置。
  5. 前記文字画像抽出手段により抽出された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
    前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
    各画像パターンの識別情報に対応付けて、それぞれの画像パターンに対応する文字画像それぞれの文字領域情報を出力する出力手段と
    をさらに有する請求項4に記載の画像辞書作成装置。
  6. 前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像の一致度合いを判定する一致判定手段
    をさらに有し、
    前記類型決定手段は、前記一致判定手段により判定された一致度合いに基づいて、同一の文字画像群に分類された複数の文字画像について、1つ以上の画像パターンを決定し、
    前記識別情報付与手段は、前記類型決定手段により同一の文字画像群について決定された1つ以上の画像パターンそれぞれに対して、それぞれの画像パターンを識別する識別情報を付与する
    請求項1〜4のいずれかに記載の画像辞書作成装置。
  7. 前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに比較して、文字画像に含まれる領域毎の一致度合いを判定する一致判定手段
    をさらに有し、
    前記類型決定手段は、前記一致判定手段により領域毎に判定された一致度合いに基づいて、文字画像を構成する複数の画像パターンを決定する
    請求項1〜4のいずれかに記載の画像辞書作成装置。
  8. 前記情報取得手段は、さらに、文字認識処理の認識確度情報をそれぞれの文字識別情報又は文字領域情報に対応付けて取得し、
    前記文字分類手段は、認識確度情報と、これに対応する文字識別情報又は文字領域情報とに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する
    請求項1〜7のいずれかに記載の画像辞書作成装置。
  9. 入力画像を構成する類型的な画像パターンを記憶するパターン記憶手段と、
    新たに入力された文字画像と、前記パターン記憶手段により記憶された画像パターンとを比較して、一致度合いを判定する一致判定手段と、
    前記一致判定手段により判定された一致判定度合いに応じて、この新たに入力された文字画像を画像パターンとして前記パターン記憶手段に記憶させる類型決定手段と
    を有する画像辞書作成装置。
  10. 前記パターン記憶手段は、それぞれの画像パターンに対応付けて、これらの画像パターンが表す文字の識別情報を記憶し、
    入力された文字画像が表す文字の識別情報と、前記パターン記憶手段に記憶されている画像パターンの識別情報とに基づいて、前記一致度合い判定手段によりそれぞれの画像パターンに対して判定された一致度合いに対して重み付けを行う重み付け手段
    をさらに有し、
    前記類型決定手段は、前記重み付け手段により重み付けされた一致度合いに基づいて、この入力された文字画像に基づく画像パターンの登録を許可するか否かを決定する
    請求項9に記載の画像辞書作成装置。
  11. 文字の識別情報は、文字コードであり、
    前記重み付け手段は、入力された文字画像の文字コードがいずれかの画像パターンの文字コードと一致する場合に、文字コードが相違する場合よりも一致度合いが高くなるように重み付けを行い、
    前記類型決定手段は、一致度合いが基準より高い場合に、この文字画像に基づく画像パターンの登録を禁止し、一致度合いが基準以下である場合に、この文字画像に基づく画像パターンの登録を許可する
    請求項10に記載の画像辞書作成装置。
  12. 文字コードは、入力画像に対する文字認識処理により判定されたものであり、
    前記重み付け手段は、入力された文字画像に対する文字認識処理の認識確度に基づいて、認識確度が高いほど一致度合いが高くなるような重み付けを行う
    請求項11に記載の画像辞書作成装置。
  13. 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、
    前記情報取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
    前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
    を有する画像辞書作成装置。
  14. 入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
    前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、
    前記文字画像抽出手段により抽出された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と
    を有する画像辞書作成装置。
  15. 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得する情報取得手段と、
    前記取得手段により取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類する文字分類手段と、
    前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、
    入力画像に含まれている文字画像の領域を示す文字領域情報と、この文字画像に対応する画像パターンの識別情報とを互いに対応付けて符号化する符号化手段と
    を有する符号化装置。
  16. 入力画像における文字画像それぞれの領域を示す文字領域情報を取得する情報取得手段と、
    前記情報取得手段により取得された文字領域情報に基づいて、入力画像から文字画像を抽出する文字画像抽出手段と、
    前記文字画像抽出手段により抽出された文字画像を、複数の文字画像群に分類する文字分類手段と、
    前記文字分類手段により各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する識別情報付与手段と、
    前記文字分類手段により各文字画像群に分類された複数の文字画像を互いに複数の相対位置で比較して、文字画像の一致度合いを判定する一致判定手段と、
    前記一致判定手段によりそれぞれの相対位置で判定された一致度合いに基づいて、それぞれの文字画像の文字領域情報を補正する領域補正手段と、
    少なくとも前記領域補正手段により補正されたそれぞれの文字画像の文字領域情報と、この文字画像が分類された文字画像群に基づいて決定された画像パターンの識別情報とを符号化する符号化手段と
    を有する符号化装置。
  17. 入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得し、
    取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、
    各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定し、
    決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与する
    画像辞書作成方法。
  18. コンピュータを含む画像辞書作成装置において、
    入力画像に含まれている文字画像と、この文字画像が表す文字を識別する文字識別情報とを取得するステップと、
    取得された文字識別情報に基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類するステップと、
    各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、
    決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップと
    を前記画像辞書作成装置のコンピュータに実行させるプログラム。
  19. コンピュータを含む画像辞書作成装置において、
    入力画像における文字画像それぞれの領域を示す文字領域情報を取得するステップと、
    取得された文字領域情報に基づいて、入力画像から文字画像を抽出するステップと、
    抽出された文字画像を、複数の文字画像群に分類するステップと、
    各文字画像群に分類された文字画像に基づいて、入力画像を構成する類型的な画像パターンを決定するステップと、
    決定された画像パターンに対して、それぞれの画像パターンを識別する識別情報を付与するステップと
    を前記画像辞書作成装置のコンピュータに実行させるプログラム。
JP2004116647A 2004-04-12 2004-04-12 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム Expired - Fee Related JP4788106B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004116647A JP4788106B2 (ja) 2004-04-12 2004-04-12 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
US11/067,904 US7889926B2 (en) 2004-04-12 2005-03-01 Image dictionary creating apparatus, coding apparatus, image dictionary creating method
CN2005100538710A CN1684492B (zh) 2004-04-12 2005-03-14 图像词典作成装置、编码装置、图像词典作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004116647A JP4788106B2 (ja) 2004-04-12 2004-04-12 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2005301663A true JP2005301663A (ja) 2005-10-27
JP4788106B2 JP4788106B2 (ja) 2011-10-05

Family

ID=35060626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004116647A Expired - Fee Related JP4788106B2 (ja) 2004-04-12 2004-04-12 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム

Country Status (3)

Country Link
US (1) US7889926B2 (ja)
JP (1) JP4788106B2 (ja)
CN (1) CN1684492B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008199249A (ja) * 2007-02-13 2008-08-28 Fuji Xerox Co Ltd 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
JP2011108163A (ja) * 2009-11-20 2011-06-02 Toshiba Corp 名刺読取装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177865B2 (ja) * 2006-09-28 2008-11-05 株式会社東芝 ベクトルグラフィックス形状データ生成装置、描画装置、方法およびプログラム
US20080212877A1 (en) * 2007-03-04 2008-09-04 John Franco High speed error detection and correction for character recognition
JP4766030B2 (ja) * 2007-10-11 2011-09-07 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4626777B2 (ja) * 2008-03-14 2011-02-09 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5408139B2 (ja) * 2008-10-09 2014-02-05 日本電気株式会社 異常検知システム、異常検知方法及び異常検知プログラム
CN101742442A (zh) * 2008-11-20 2010-06-16 银河联动信息技术(北京)有限公司 通过短信息传输电子凭证的系统和方法
CN102930575B (zh) * 2011-08-08 2017-07-25 深圳市世纪光速信息技术有限公司 一种辅助图形绘制的方法、装置及信息终端
US8494284B2 (en) * 2011-11-21 2013-07-23 Nokia Corporation Methods and apparatuses for facilitating detection of text within an image
CN103577820B (zh) * 2012-07-31 2017-08-25 乐金信世股份有限公司 字符识别方法、字符识别装置及金融设备
CN103561276B (zh) * 2013-11-07 2017-01-04 北京大学 一种图像视频编解码方法
JP2016153933A (ja) * 2015-02-20 2016-08-25 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体
US9848237B2 (en) 2015-10-21 2017-12-19 Rovi Guides, Inc. Systems and methods for identifying a source of a user interface from a fingerprint of the user interface
US10158784B2 (en) 2016-12-07 2018-12-18 Xerox Corporation System and method for adaptively compressing data having noisy images using lossless compression
JP6866636B2 (ja) * 2016-12-26 2021-04-28 カシオ計算機株式会社 文字編集方法、電子機器、及び、プログラム
US10438098B2 (en) 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines
RU2652461C1 (ru) 2017-05-30 2018-04-26 Общество с ограниченной ответственностью "Аби Девелопмент" Дифференциальная классификация с использованием нескольких нейронных сетей

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229489A (ja) * 1986-03-31 1987-10-08 Toshiba Corp パタ−ン認識学習装置
JPS6382061A (ja) * 1986-09-26 1988-04-12 Ricoh Co Ltd デ−タ圧縮方式
JPH06231310A (ja) * 1993-02-05 1994-08-19 Fujitsu Ltd 文字認識装置における文字認識方法
JPH08255223A (ja) * 1995-03-16 1996-10-01 Fuji Electric Co Ltd 文字認識装置における類似文字判別方法
JPH10178638A (ja) * 1996-12-18 1998-06-30 Nippon Telegr & Teleph Corp <Ntt> 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置
JP2000067164A (ja) * 1998-08-26 2000-03-03 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP2001236467A (ja) * 2000-02-21 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2003050971A (ja) * 2001-08-07 2003-02-21 Riso Kagaku Corp フォント選択プログラム、画像処理装置及び画像形成装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729637A (en) * 1994-08-31 1998-03-17 Adobe Systems, Inc. Method and apparatus for producing a hybrid data structure for displaying a raster image
US5889897A (en) * 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
KR100454541B1 (ko) 1998-04-27 2004-11-03 산요덴키가부시키가이샤 수기 문자 인식 방법 및 시스템
US6741745B2 (en) * 2000-12-18 2004-05-25 Xerox Corporation Method and apparatus for formatting OCR text
CN1726715A (zh) * 2002-12-16 2006-01-25 皇家飞利浦电子股份有限公司 存储介质上用于交互式电视录制和重放的字体库

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62229489A (ja) * 1986-03-31 1987-10-08 Toshiba Corp パタ−ン認識学習装置
JPS6382061A (ja) * 1986-09-26 1988-04-12 Ricoh Co Ltd デ−タ圧縮方式
JPH06231310A (ja) * 1993-02-05 1994-08-19 Fujitsu Ltd 文字認識装置における文字認識方法
JPH08255223A (ja) * 1995-03-16 1996-10-01 Fuji Electric Co Ltd 文字認識装置における類似文字判別方法
JPH10178638A (ja) * 1996-12-18 1998-06-30 Nippon Telegr & Teleph Corp <Ntt> 文字領域符号化方法、復号方法、文字領域符号化装置および復号装置
JP2000067164A (ja) * 1998-08-26 2000-03-03 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP2001236467A (ja) * 2000-02-21 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2003050971A (ja) * 2001-08-07 2003-02-21 Riso Kagaku Corp フォント選択プログラム、画像処理装置及び画像形成装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008199249A (ja) * 2007-02-13 2008-08-28 Fuji Xerox Co Ltd 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム
JP2010098744A (ja) * 2008-10-20 2010-04-30 Toshiba Corp 画像処理装置及び画像処理方法
JP2011108163A (ja) * 2009-11-20 2011-06-02 Toshiba Corp 名刺読取装置

Also Published As

Publication number Publication date
CN1684492A (zh) 2005-10-19
CN1684492B (zh) 2010-09-08
US20050226517A1 (en) 2005-10-13
US7889926B2 (en) 2011-02-15
JP4788106B2 (ja) 2011-10-05

Similar Documents

Publication Publication Date Title
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
KR100938099B1 (ko) 클러스터링 시스템, 클러스터링 방법, 문서 인코딩 시스템 및 클러스터링 방법을 수행하기 위한 컴퓨터 판독가능 매체
US7623712B2 (en) Image processing method and apparatus
US5970483A (en) Apparatus and methodology for submitting search queries
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
CN101419673B (zh) 图像词典生成装置及方法
JP2001203897A (ja) パタンマッチング符号化装置及び方法
US20060182358A1 (en) Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof
JP4645058B2 (ja) 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
US7355529B2 (en) Binary image compression apparatus and method
JP2005352735A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
CN100501728C (zh) 图像处理方法、系统、程序、程序存储介质以及信息处理设备
US20020085756A1 (en) System and method for efficient determination of recognition initial conditions
JP2005323169A (ja) 画像処理装置、データファイル、画像処理方法及びそのプログラム
JP4465654B2 (ja) 画像辞書作成装置、符号化装置、符号化方法及びそのプログラム
JP2020047138A (ja) 情報処理装置
JP4973603B2 (ja) 画像処理装置および画像処理プログラム
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2005352734A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JP2005352736A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP3862314B2 (ja) 信号処理方法とその装置
JP2008123244A (ja) 画像処理装置及び画像処理プログラム
JP2005078555A (ja) オブジェクト識別装置、識別方法、この方法のプログラム、およびこのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070322

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110621

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110704

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4788106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees