JP2005323169A - 画像処理装置、データファイル、画像処理方法及びそのプログラム - Google Patents

画像処理装置、データファイル、画像処理方法及びそのプログラム Download PDF

Info

Publication number
JP2005323169A
JP2005323169A JP2004139763A JP2004139763A JP2005323169A JP 2005323169 A JP2005323169 A JP 2005323169A JP 2004139763 A JP2004139763 A JP 2004139763A JP 2004139763 A JP2004139763 A JP 2004139763A JP 2005323169 A JP2005323169 A JP 2005323169A
Authority
JP
Japan
Prior art keywords
image
character
pattern
identification information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004139763A
Other languages
English (en)
Inventor
Shunichi Kimura
俊一 木村
Yutaka Koshi
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004139763A priority Critical patent/JP2005323169A/ja
Publication of JP2005323169A publication Critical patent/JP2005323169A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 データ圧縮がなされた画像データに対して、画像データの伸長処理を行うことなく文字画像の操作を行うことができる画像処理装置を提供する。
【解決手段】 画像処理装置2は、入力画像に基づいて画像辞書902に登録すべき画像パターンを決定し、決定された画像パターンに対してインデクスを付与し、入力画像に含まれる文字画像を同一又は近似する画像パターンのインデクスと置換して入力画像の画像データを圧縮する。さらに、画像処理装置2は、それぞれの画像パターンに付与されたインデクスと、それぞれの画像パターンに対応する文字の文字コードとを互いに対応付ける文字対応テーブル904を作成する。画像処理装置2は、この文字対応テーブル904により対応付けられたインデクス及び文字コードを用いて、圧縮された入力画像に対して文字検索又は文字置換等の画像操作を行う。
【選択図】図9

Description

本発明は、データ圧縮がなされた画像データに対して文字画像の操作を行う画像処理装置に関する。
例えば、特許文献1は、写真画像、図形にて構成される第1の画像と文字にて構成される第2の画像を有する画像情報が入力され、この画像情報の中の第2の画像の領域を検出し、画像情報の中から第2の画像の領域を抜き取って記録する画像記録装置を開示する。これにより、第2の画像の領域内の文字を文字コードに変換して記録し、検索用キーワードとして用いることができる。
特許第2895834号公報
本発明は、上述した背景からなされたものであり、データ圧縮がなされた画像データに対して、画像データの伸長処理を行うことなく文字画像の操作を行うことができる画像処理装置を提供することを目的とする。
[画像処理装置]
上記目的を達成するために、本発明にかかる画像処理装置は、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに基づいて、入力画像の画像データを圧縮する圧縮手段と、少なくとも、前記類型決定手段により決定された画像パターンと、文字識別情報とを互いに対応付ける対応付け手段とを有する。
好適には、前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与する識別情報付与手段をさらに有し、前記圧縮手段は、入力画像に含まれる文字画像を、対応する画像パターンに付与されたパターン識別情報と置換することにより、入力画像の画像データを圧縮し、前記対応付け手段は、前記識別情報付与手段により付与されたパターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを生成することにより、画像パターンと文字識別情報とを互いに対応付ける。
好適には、前記類型決定手段により決定された画像パターンの画像データを符号化するパターン符号化手段をさらに有し、少なくとも、前記対応付け手段により生成された文字対応テーブルと、前記パターン符号化手段により符号化された画像パターンとを出力する出力手段とをさらに有する。
好適には、入力画像に含まれる文字画像それぞれが表す文字の文字識別情報を取得する情報取得手段をさらに有し、前記対応付け手段は、前記情報取得手段により取得された文字識別情報と、この文字識別情報に対応する文字画像に基づいて決定された画像パターンとを互いに対応付ける。
好適には、前記情報取得手段は、入力画像に含まれる文字画像のフォント情報をさらに取得し、前記対応付け手段は、前記情報取得手段により取得された文字識別情報及びフォント情報と、画像パターンとを互いに対応付ける。
また、本発明にかかる画像処理装置は、文字画像を構成する類型的な画像パターンとこの画像パターンそれぞれを識別するパターン識別情報とを互いに対応付ける画像辞書テーブル、この画像辞書テーブルに基づいて符号化された対象画像、及び、パターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを取得するデータ取得手段と、前記データ取得手段により取得された文字対応テーブルを用いて、対象画像に含まれる文字画像を操作する画像操作手段とを有する。
好適には、前記画像操作手段は、前記文字対応テーブルにより互いに対応付けられた文字識別情報及びパターン識別情報に基づいて、対象画像に含まれる文字画像の検索処理又は置換処理を行う。
好適には、前記文字対応テーブルは、さらに、画像パターンそれぞれに対応するフォント情報を前記パターン識別情報に対応付け、前記データ取得手段は、前記画像辞書テーブル、符号化された対象画像、及び、パターン識別情報を文字識別情報とフォント情報とに対応付ける文字対応テーブルを取得し、前記画像操作手段は、文字対応テーブルによりパターン識別情報と対応付けられたフォント情報に基づいて、対象画像に含まれる文字画像に対してフォントの変更処理又は拡縮処理を行う。
[データファイル]
また、本発明にかかるデータファイルは、対象画像に基づいて生成された画像パターンのデータと、この画像パターンに基づいて圧縮された対象画像のデータと、この画像パターンと文字識別情報とを互いに対応付ける文字対応テーブルとを有する。
[画像処理方法]
また、本発明にかかる画像処理方法は、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与し、決定された画像パターン及びこれらの画像パターンに付与されたパターン識別情報に基づいて、入力画像に含まれる文字画像をパターン識別情報に置換して、入力画像の画像データを圧縮し、それぞれの画像パターンに付与されたパターン識別情報と文字識別情報とを互いに対応付け、互いに対応付けられたパターン識別情報及び文字識別情報を用いて、圧縮された入力画像に対して文字画像の操作を行う。
[プログラム]
また、本発明にかかるプログラムは、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに基づいて入力画像の画像データを圧縮するステップと、少なくとも、決定された画像パターンと文字識別情報とを互いに対応付けて出力するステップとをコンピュータに実行させる。
本発明の画像処理装置によれば、データ圧縮がなされた画像データに対して、画像データの伸長処理を行うことなく文字画像の操作を行うことができる。
[第1実施形態]
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置2は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等とを符号化することにより、高い圧縮率を実現することができる。
図1(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図1(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。
図1(A)に示すように、文字画像を識別情報(文字コード、フォントの種類及びフォントサイズ等)に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、入力画像に含まれる文字画像の替わりに、文字画像の識別情報(文字コード、フォントの種類及びフォントサイズ等)と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを圧縮し復号化側の画像処理装置に送信することができる。
この場合に、復号化側の画像処理装置は、受信した符号データ(文字コード、フォントの種類及びフォントサイズ)を復号化し、復号化された文字コード、フォントの種類及びフォントサイズ、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成して入力画像を再現する。また、復号化側の画像処理装置は、復号化された文字コード、フォントの種類及びフォントサイズ等を用いることにより、画像全体を再現することなく、入力画像に含まれている文字画像の検索及び置換などを行うことができる。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも符号化側と同一内容になるよう更新する必要がある。また、復号時には、フォントデータベースに基づいてフォント画像を生成する必要がある。
そこで、本実施形態における画像処理装置2は、図1(B)に示すように、符号化側において、入力画像内で類型的に存在する画像パターンをインデクスに対応付けて登録(画像辞書化)し、入力画像に含まれる文字画像を、この文字画像と一致する画像パターンのインデクス及び文字画像の出現位置に置換して画像データを圧縮し符号化する。符号化側の画像処理装置2は、画像パターン及びインデクスが互いに対応付けられた画像辞書と、符号化されたインデクス及び出現位置とを復号化側に送信する。
復号化側の画像処理装置2は、インデクス及び出現位置を復号化し、復号化されたインデクスに対応する画像パターンを画像辞書から選択し、選択された画像パターンを復号化された出現位置に配置して入力画像を再現する。
このように、本実施形態における画像処理装置2は、入力画像に基づいて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。
次に、本実施形態における画像操作の概要を説明する。ここで、画像操作とは、入力画像に対する操作を意味し、例えば、文字画像の検索処理、置換処理、拡大処理、縮小処理、フォントの種類の変更処理、文字画像の回転処理、文字画像の射影変換処理、文字画像のアフィン変換処理などが含まれる。
本実施形態における画像処理装置2は、画像操作を実現するために、画像パターンと、これら画像パターンに対応する文字を識別するための文字識別情報とを互いに対応付ける。より具体的には、符号化側の画像処理装置2は、入力画像に基づいて生成された画像パターンと、これら画像パターンに対応する文字識別情報とを互いに対応付ける文字対応テーブルを作成し、作成された文字対応テーブルを符号データと共に復号化側の画像処理装置2に送信する。
復号化側の画像処理装置2は、受信した文字対応テーブルに基づいて、入力画像に含まれる文字画像に対して、検索処理などの画像操作を行うことができる。
図2(A)は、画像辞書902を例示し、図2(B)は、第1の文字対応テーブル904を例示し、図2(C)は、この画像辞書902に基づいて再現される入力画像を例示する図である。
図2(A)に例示するように、画像辞書902には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクス(パターン識別情報)とが含まれている。画像パターンは、入力画像に含まれる部分的な画像データであり、ラスタライズされた画像データであることが望ましい。本例の画像パターンは、入力画像(2値)中に既定回数以上(複数回)出現する類型的なパターン(2値データ)である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。
図2(B)に例示するように、文字対応テーブル904には、画像辞書902に登録されているインデクスと、それぞれのインデクスに対応する文字コードとが含まれている。文字コードは、インデクスに対応する画像パターンが表す文字を識別する文字識別情報の一例であり、それぞれの画像パターンに対応する文字のコードである。すなわち、本例では、インデクスを介して画像パターンと文字コードとが互いに対応付けられている。なお、画像パターンは文字コード(文字識別情報)と直接対応付けられてもよい。
画像辞書902に基づいて符号データが復号化されると、図2(C)に例示するように、画像パターン(図中における文字画像「A」、文字画像「B」、文字画像「C」など)が配置されて入力画像が再現される。これらの文字画像は、画像辞書902及び文字対応テーブル904によって、文字コードと対応付けられている。したがって、本実施形態における画像処理装置2は、文字コードに基づいて入力画像に含まれる文字画像を指定して画像操作を行うことができる。例えば、画像処理装置2は、文字コードを指定して文字の置換が指示されると、文字対応テーブル904を参照してこの文字コードに対応するインデクスを特定し、特定されたインデクスに対応する画像パターンのデータを他の文字画像のデータに置換することにより、入力画像に含まれる文字画像を置換することができる。例えば、画像辞書902においてインデクス「#014」に対応する画像パターン(「ファイル014」)が他の文字画像のデータと置換されると、入力画像における文字画像「B」が他の文字画像に置換される。
このように、本実施形態における画像処理装置2は、文字コード(文字識別情報)と画像パターンとを互いに対応付けることにより、入力画像の符号データを復号化して再現することなく、文字検索及び文字置換などの画像操作を行うことができる。
[ハードウェア構成]
次に、画像処理装置2のハードウェア構成を説明する。
図3は、本発明にかかる画像処理方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図3に例示するように、画像処理装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
画像処理装置2は、例えば、符号化プログラム5(後述)及び画像操作プログラム7(後述)の少なくとも一方がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置22又は記録装置24などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置10に送信する。また、画像処理装置2は、プリンタ装置10のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。
[符号化プログラム]
図4は、制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する符号化プログラム5の機能構成を例示する図である。
図4に例示するように、符号化プログラム5は、画像入力部40、画像辞書作成部50及び符号化部60を有する。
符号化プログラム5において、画像入力部40は、プリンタ装置10のスキャナ機能により読み取られた画像データ、又は、通信装置22又は記録装置24などを介して取得されたPDL(Page Discription Language)形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部50に出力する。また、画像入力部40は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部410と、PDL形式の画像データを解釈してラスタデータを生成するPDLデコンポーザ420とを有する。
文字認識部410(情報取得手段)は、入力されたスキャン画像の画像データ(以下、入力画像)に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部50に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード(ASCIIコード又はシフトJISコードなど)である。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せからなる文字のレイアウト情報である。なお、文字認識部410は、認識された文字コードに属するフォント画像と、文字画像とを比較することにより、入力画像に含まれる文字画像のフォント情報を判別してもよい。ここで、フォント情報とは、フォント画像の形状、大きさ又は色等を規定する情報であり、フォントの種類(ゴシック、イタリック又は明朝など)、フォントサイズ(ポイント数)、及び、フォントの色などが含まれる。
PDLデコンポーザ420(情報取得手段)は、PDL形式の画像データを解釈してラスタライズされた画像データ(ラスタデータ)を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報、フォント情報及び文字領域情報を画像辞書作成部50に対して出力する。
画像辞書作成部50は、画像入力部40から入力された入力画像に基づいて、この入力画像の符号化処理に用いられる画像辞書902を作成し、作成された画像辞書902と入力画像とを符号化部60に対して出力する。より具体的には、画像辞書作成部50は、文字認識部410又はPDLデコンポーザ420から入力された文字識別情報及び文字領域情報等に基づいて、入力画像から文字画像を切り出し、切り出された文字画像の出現頻度等に基づいて画像辞書902に登録すべき画像パターンを作成し、作成された画像パターン(文字画像)にインデクスを付与して符号化部60に出力する。
また画像辞書作成部50は、画像パターンに付与されたインデクスと、この画像パターンに対応する文字の文字識別情報とを互いに対応付ける文字対応テーブル904を作成し、符号化部60に対して出力する。
符号化部60は、画像辞書作成部50から入力された画像辞書902に基づいて入力画像を符号化し、符号化された入力画像と画像辞書とを記録装置24(図3)又はプリンタ装置10(図3)などに出力する。より具体的には、符号化部60は、画像辞書902に登録された画像パターンと、入力画像に含まれる部分画像とを比較して、いずれかの画像パターンと一致する部分画像のデータを、この画像パターンに対応するインデクス及びこの部分画像の位置情報に置換する。ここで、一致とは、完全一致だけを言うのではなく、既定の許容範囲内で部分的に一致している場合を含む。さらに、符号化部60は、部分画像と置き換えられたインデクス及び位置情報、並びに、画像辞書902等をエントロピー符号化(ハフマン符号化、算術符号化又はLZ符号化など)により符号化してもよい。
また、符号化部60は、画像辞書作成部50から入力された文字対応テーブル904を、入力画像の符号データと対応付ける。
図5は、画像辞書作成部50の機能をより詳細に説明する図である。
図5に示すように、画像辞書作成部50は、記憶部500、文字画像抽出部510、一致判定部520、辞書決定部530、位置補正部540、インデクス付与部550、登録制御部560及びテーブル生成部570を有する。記憶部500は、メモリ204(図3)及び記録装置24(図3)を制御して、画像入力部40(図4)から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。
文字画像抽出部510は、文字の位置情報に基づいて、入力画像から文字画像を切り出す。すなわち、文字画像抽出部510は、文字領域情報により示された領域を文字画像として入力画像から抽出する。抽出される文字画像は、文字認識部410により文字画像であると判定された領域である。なお、文字認識部410又はPDLデコンポーザ420が文字画像を入力画像から切り出した状態で画像辞書作成部50に出力してもよい。
一致判定部520は、入力画像から切り出された文字画像と、画像辞書902に登録された画像パターンとを比較して、これらの一致度合いを判定する。ここで、一致度合いとは、複数の画像が互いに一致する程度を示す情報であり、例えば、2値画像が比較される場合に、2つの画像を重ねたときの互いに重なりあう画素の数(以下、一致画素数)、この一致画素数を正規化した一致画素率(例えば、一致画素数を全画素数で割ったもの)、又は、複数の画像を重ねたときの画素分布(ヒストグラム)などである。
また、一致判定部520は、入力画像から切り出された文字画像と、画像辞書902に登録された画像パターンとを複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部520は、最大の一致度合いを算出するために、新たに切り出された文字画像と、画像辞書902に登録された画像パターンとを、これらの相対位置を変更しながら(ずらしながら)比較する。
例えば、一致判定部520は、入力画像から切り出された文字画像と、この文字画像と文字コードが一致する画像パターンとを互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部500に出力する。
辞書決定部530は、文字画像抽出部510により切り出された文字画像と、一致判定部520により判定された一致度合いとに基づいて、画像辞書に登録すべき画像パターンを決定する。例えば、辞書決定部530は、新たに切り出された文字画像と、画像辞書902に登録されている画像パターンとの一致度合いがいずれも基準値未満である場合に、この文字画像を画像パターンとして決定する。
位置補正部540は、一致判定部520から出力されたずらしベクトルに基づいて、文字画像の位置情報を補正する。すなわち、位置補正部540は、画像入力部40から入力された文字画像の位置情報を、この文字画像と画像パターンとの一致度合いが最大となるように補正する。
インデクス付与部550は、入力画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部500に出力する。
登録制御部560は、文字画像抽出部510により抽出された文字画像と画像パターンとの一致度合いに基づいて、新たに画像パターンを登録するか否かを判断し、画像辞書への新規登録を制御する。具体的には、登録制御部560は、順次入力される文字画像と画像辞書に登録された画像パターンとの一致度合いに基づいて、新たに切り出された文字画像を画像パターンとして画像辞書に登録するか否かを判断する。例えば、登録制御部560は、既登録の画像パターンと、入力された文字画像との一致度合いがいずれも基準未満である場合(すなわち、一致する画像パターンが登録されていない場合)に、この文字画像を画像パターンとして画像辞書に登録することを許可し、一致度合いが基準以上となる画像パターンが存在する場合(すなわち、一致する画像パターンが存在する場合)に、この文字画像を画像パターンとして画像辞書に登録することを禁止する。
テーブル生成部570は、辞書決定部530により決定された画像パターンと、この画像パターンに対応する文字コードとを互いに対応付ける。具体的には、テーブル生成部570は、それぞれの画像パターンに付与されたインデクスと、この画像パターンに対応する文字コードとが互いに対応付けられた文字対応テーブル904を作成する。例えば、テーブル生成部570は、入力画像に含まれる文字画像に基づいて画像パターンが順次決定される場合に、文字画像に基づいて決定された画像パターンのインデクスと、この文字画像について文字認識部410又はPDLデコンポーザ420から入力された文字コードとを文字対応テーブル904に順次登録していく。
図6は、符号化部60の機能をより詳細に説明する図である。
図6に示すように、符号化部60は、パターン判定部610、位置情報符号化部620、インデクス符号化部630、画像符号化部640、辞書符号化部650、選択部660及び符号出力部670を有する。
パターン判定部610は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン(同一又は類似の画像パターン)を判定する。具体的には、パターン判定部610は、入力画像から文字画像単位で切り出された部分画像(位置補正部540により補正がなされたもの)と、画像パターンとを重ねあわせて、一致判定部520(図5)と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部610は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部620に対して出力し、この画像パターンのインデクスをインデクス符号化部630に対して出力する。また、パターン判定部610は、対応する画像パターンが発見されない場合には、この部分画像の画像データを画像符号化部640に対して出力する。
なお、本実施形態におけるパターン判定部610は、入力画像から切り出された文字画像と一致する画像パターンのインデクス、及び、文字画像の位置情報(位置補正部540により補正されたもの)を画像辞書作成部50から取得するため、文字画像として切り出された部分画像については、画像辞書作成部50から入力されたインデクス及び位置情報をそれぞれインデクス符号化部630及び位置情報符号化部620に出力し、文字画像として切り出されなかった部分画像(写真画像又は図形画像など)について、この部分画像の画像データを画像符号化部640に出力する。
位置情報符号化部620は、パターン判定部610から入力された位置情報(すなわち、位置補正部540により補正された部分画像(文字画像)の位置情報)を符号化し、選択部660に対して出力する。例えば、位置情報符号化部620は、LZ符号化又は算術符号化等を適用して、位置情報を符号化する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、選択部660に対して出力する。例えば、インデクス符号化部630は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部640は、画像(ラスタライズされた画像データ)に適した符号化方式を適用して、パターン判定部610から入力された部分画像を符号化し、選択部660に対して出力する。
辞書符号化部650(パターン符号化手段)は、画像辞書作成部50(図4,図5)から入力された画像辞書(画像パターンとインデクスとが互いに対応付けられたもの)を符号化し、符号出力部670に対して出力する。例えば、辞書符号化部650は、画像辞書902に含まれる画像パターン(ラスタデータ)を、画像に適した符号化方式により符号化する。なお、本例の画像辞書符号化部650は、テーブル生成部570により作成された文字対応テーブル904を、画像辞書の符号データに対応付けて符号出力部670に対して出力する。
選択部660は、パターン判定部610により部分画像に対応する画像パターンが発見された場合に、位置情報符号化部620から入力された位置情報の符号データと、インデクス符号化部630から入力されたインデクスの符号データとを互いに対応付けて符号出力部670に対して出力し、パターン判定部610により部分画像に対応する画像パターンが発見されなかった場合に、画像符号化部640により符号化された部分画像の符号データを符号出力部670に対して出力する。
符号出力部670は、選択部660から入力された符号データ(位置情報、インデクス及び部分画像の符号データ)と、辞書符号化部650から入力された符号データ(画像辞書の符号データ)と、文字対応テーブル904とを互いに対応付けてプリンタ装置10(図3)、記録装置24(図3)又は通信装置22(図3)に出力する。
[符号化動作]
次に、画像処理装置2による符号化処理の全体動作を説明する。
図7は、第1の実施形態における符号化プログラム5の動作(S10)を示すフローチャートである。なお、説明の便宜のために2値の画像データが入力される場合を具体例とする。
図7に示すように、ステップ100(S100)において、画像入力部40(図4)は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を1文字ずつ判定し、判定された文字コード及び位置情報を画像辞書作成部50に対して出力する。
ステップ102(S102)において、画像辞書作成部50の記憶部500(図5)は、画像入力部40から入力される入力画像(2値)、文字コード及び位置情報をメモリ204(図3)に記憶する。
文字画像抽出部510(図5)は、入力された位置情報に基づいて、入力画像から文字画像を1文字分ずつ切り出して記憶部500に出力する。
ステップ104(S104)において、登録制御部560は、入力画像から順に切り出される文字画像の文字コードに基づいて、画像辞書902から画像パターン及びこの画像パターンのインデクスを読み出す。具体的には、記憶部500は、既に決定された画像パターン、この画像パターンに対して付与されたインデクス、及び、この画像パターンに対応する文字画像の文字コードを互いに対応付けて画像辞書として記憶している。登録制御部560は、文字画像抽出部510により新たに切り出された文字画像の文字コードを文字認識部410から取得し、取得された文字コードに対応する画像パターン及びインデクスを画像辞書から読み出す。
ステップ106(S106)において、一致判定部520は、文字画像抽出部510により順次切り出される文字画像と、画像辞書に登録されている画像パターンとを比較して、複数の相対位置における一致度合いを判定する。具体的には、一致判定部520は、画像辞書に登録されている画像パターンそれぞれと、切り出された文字画像とを互いにずらしながら黒画素の一致画素数Kを算出する。
一致画素数Kは、画像における相対的な位置を示す位置ベクトルをx、画像パターンの黒画素の分布をS(x)、順に切り出される文字画像の番号をi(1〜N)、文字画像の黒画素の分布をP(i,x)、文字画像iのずらしベクトルをviとした場合に、以下の数式により算出される。
(一致画素数K)=Σ{S(x)*P(i,x−vi)}
なお、「Σ」は、変数xについての総和を示す。
次に、一致判定部520は、算出された一致画素数Kを正規化して、一致画素率K’を算出する。
一致画素率K’は、文字画像を構成する画素数をMとした場合に、以下の数式により算出される。
(一致画素率K’)=K/M
ステップ108(S108)において、登録制御部560は、一致判定部520により判定された画像パターンと文字画像(新たに切り出されたもの)との一致度合いに基づいて、新たに切り出された文字画像に基づいて画像パターンを登録するか否かを判定する。具体的には、登録制御部560は、判定された一致画素率K’が基準値以上である場合に、最も一致画素率K’が大きな画像パターンのインデクスと、切り出された文字画像の位置情報とを符号化部60に対して出力して、S122の処理に移行し、判定された一致画素率K’が基準値よりも小さい場合に、S110の処理に移行する。
すなわち、登録制御部560は、一致度合いが基準以上である場合には、この文字画像に基づく画像パターンの登録を禁止して、この文字画像を既登録の画像パターンに基づいて符号化するよう符号化部60に指示し、一致度合いが基準よりも小さい場合には、この文字画像を画像パターンとして画像辞書に新規登録するよう辞書決定部530に指示する。
ステップ110(S110)において、辞書決定部530は、切り出された文字画像を画像パターンとして決定する。
また、インデクス付与部550は、辞書決定部530により決定された画像パターンに対して、この画像パターンを一意に識別する識別情報(インデクス)を付与する。そして、インデクス付与部550は、付与したインデクスを画像パターンに対応付けて画像辞書として記憶部500に格納する。付与されるインデクスは、少なくとも、符号化対象として入力された全入力画像について、それぞれの画像パターンを一意に識別するものである。
また、画像辞書作成部50は、この文字画像に付与されたインデクス、及び、この文字画像の位置情報を符号化対象データとして符号化部60に対して順次出力する。
ステップ112(S112)において、テーブル生成部570は、切り出された文字画像が新たに画像パターンとして決定されると、この画像パターンに付与されたインデクスと、この文字画像の文字コードとを互いに対応付けて文字対応テーブル904に追加する。なお、文字対応テーブル904は、入力画像が入力されると初期化されて、この入力画像について画像パターンが決定されると、エントリ(インデクスと文字コードとの組)が文字対応テーブル904に追加されていく。
ステップ114(S114)において、位置補正部540は、入力画像から切り出された文字画像と画像辞書に登録された画像パターンとについて、一致判定部520により複数の相対位置で算出される一致度合い(一致画素数K又は一致画素率K’)に基づいて、文字認識部410から入力された位置情報の補正ベクトルを決定する。具体的には、位置補正部540は、S106において、切り出された文字画像と画像パターンとについて算出される一致画素数Kが最大となったときのずらしベクトルviを補正ベクトルとする。
すなわち、画像辞書作成部50は、切り出された文字画像に対応する画像パターンが既に画像辞書902に登録されている場合に、登録されている画像パターンとこの文字画像とが最も一致するように切出し位置(文字画像の位置情報)を補正する。
なお、補正ベクトルにより補正された文字画像の位置情報は、この文字画像に対応する画像パターンのインデクスと共に、符号化対象データとして順次符号化部60に出力される。
ステップ116(S116)において、符号化部60は、画像辞書作成部50から符号化対象データとして入力されるインデクス及び文字画像の位置情報(位置補正部540により補正されたもの)を符号化し、符号化されたインデクス及び位置情報(符号データ)を順次プリンタ装置10又は記録装置24等に出力する。具体的には、位置情報符号化部620が、画像辞書作成部50から入力される位置情報を符号化し、インデクス符号化部630が、画像辞書作成部50から入力されるインデクスを符号化し、選択部660及び符号出力部670が、符号化された位置情報及びインデクスを互いに対応付けて出力する。
ステップ118(S118)において、符号化プログラム5は、入力画像に含まれる全ての文字画像について符号化処理が終了したか否かを判定し、全ての文字画像について終了している場合にS120の処理に移行し、これ以外の場合にS102の処理に戻り次の文字画像を切り出してS104からS116までの処理を繰り返す。
なお、符号化プログラム5は、入力画像に含まれる文字画像以外の部分画像については、画像に適した符号化方式(MH、MMRなど)を適用して符号化する。
ステップ120(S120)において、符号化部60は、画像辞書として登録された画像パターンを符号化する。具体的には、辞書符号化部650は、画像に適した符号化方式を適用して、画像辞書作成部50から入力された画像パターンを符号化する。
ステップ122(S122)において、符号化部60は、符号化された画像辞書と、画像辞書作成部50により作成された文字対応テーブル904とを、入力画像の符号データに対応付けてプリンタ装置10又は記録装置24等に出力する。
[画像操作プログラム]
次に、上記のように符号化された画像データに対する画像操作を説明する。
図8は、制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する第1の画像操作プログラム7の機能構成を例示する図である。
図8に例示するように、画像操作プログラム7は、データ取得部700、記憶部710、文字検索部720、文字置換処理部730、復号化処理部740及び画像出力部750を有する。なお、文字検索部720及び文字置換処理部730はそれぞれ画像操作手段の一例である。
画像操作プログラム7において、データ取得部700は、利用者により操作対象となる画像データのデータファイルが指定されると、符号化プログラム5(図4)により符号化されたデータファイルの中から、指定されたデータファイルを取得し、取得されたデータファイルを記憶部710に対して出力する。このデータファイルには、符号化プログラム5により符号化された入力画像の画像データに加えて、上記画像辞書902及び文字対応テーブル904が含まれている。
記憶部710は、メモリ204(図3)及び記録装置24(図3)を制御して、データ取得部700により取得されたデータファイルを記憶する。
文字検索処理部720は、利用者から所望の文字を指定して検索処理が指示されると、データファイルに含まれている文字対応テーブル904に基づいて、指定された文字が入力画像に含まれているか否かを判断する。具体的には、文字検索処理部720は、指定された文字に対応する文字コードが文字対応テーブル904に存在するか否かを判断し、指定された文字の文字コードが文字対応テーブル904に存在する場合には、指定された文字が入力画像内で発見された旨を出力し、指定された文字の文字コードが文字対応テーブル904に存在しない場合には、指定された文字が入力画像内で発見されなかった旨を出力する。
なお、文字検索処理部720は、文字列の検索が指示された場合に、文字列を構成する各文字の文字コードに対応するインデクスをそれぞれ特定し、特定されたインデクスに対応付けられた位置情報に基づいて、文字列の有無を判断してもよい。また、文字列に相当する画像パターンが画像辞書902に登録されてもよく、この場合に、テーブル生成部570は、文字列に含まれる文字コードとこの文字列に対応する画像パターンのインデクスとを互いに対応付けて文字対応テーブル904に登録し、文字検索処理部720は、この文字対応テーブル904を参照することにより、複数の文字からなる文字列の検索を行うことができる。
文字置換処理部730は、利用者から置換前の文字及び置換後の文字を指定して置換処理が指示されると、データファイルに含まれている文字対応テーブル904に基づいて、画像辞書902を変更することにより、指示された置換処理を実現する。具体的には、文字置換処理部730は、置換前の文字として指定された文字の文字コードを文字対応テーブル904で検索し、置換前の文字の文字コードに対応するインデクスを特定し、画像辞書902においてこのインデクスに対応する画像パターンを、置換後の文字画像のデータに変更することにより、文字画像の置換を実現する。
なお、置換後の文字画像が入力画像に含まれている場合には、文字置換処理部730は、文字対応テーブル904を参照して、置換後の文字の文字コードに対応するインデクスを特定し、特定されたインデクスに対応する画像パターンの符号データ(すなわち、置換後の文字の符号データ)を画像辞書902から抽出し、抽出された符号データを置換後の文字画像のデータとして利用してもよい。
復号化処理部740は、入力画像の出力(印刷又はモニタ表示)が指示されると、データファイルに含まれている画像辞書902を用いて、入力画像の符号データを復号化する。具体的には、復号化処理部740は、画像辞書902に含まれている画像パターンの符号データ、及び、入力画像の符号データ(インデクス及び位置情報など)を復号化し、復号化されたインデクス及び位置情報に基づいて画像パターンを配置することにより入力画像を再現(伸長)する。
画像出力部750は、入力画像の出力が指示された場合に、プリンタ装置10(図3)又はUI装置26(図3)を制御して、復号化処理部740により復号化された入力画像の画像データ(ラスタデータ)を印刷又は表示する。
[画像操作処理]
次に、画像処理装置2による画像操作処理を説明する。
図9は、文字置換処理の概略を説明する図である。
図9に示すように、利用者から置換前の文字及び置換後の文字が指定されると、文字置換処理部730は、指定された置換前の文字に対応する文字コードを文字対応テーブル904内で検索し、置換前の文字に対応するインデクスを特定する。本例では、文字画像「B」を文字画像「A」に置換することが指示されているため、文字置換処理部730は、文字コード「0x42」(置換前の文字「B」に相当)を文字対応テーブル904で検索して、インデクス「#014」を特定する。
次に、文字置換処理部730は、画像辞書902において、特定されたインデクス「#014」に対応する画像パターン(文字画像「B」に相当)を、置換後の文字画像「A」のデータ(ファイル022)に置換する。本例では、文字画像「A」に相当する画像パターン「ファイル022」が画像辞書902に登録されているので、文字置換処理部730は、画像辞書902から置換後の文字画像のデータ「ファイル002」を読み出して置換処理に利用する。具体的には、文字置換処理部730は、文字対応テーブル904を参照して、置換後の文字の文字コード「0x41」に対応するインデクス「#022」(文字画像「A」に相当)を特定し、特定されたインデクス「#022」に対応する画像パターン(ファイル022)を画像辞書902から読み出す。
このように画像辞書902に登録された画像パターンが置換されると、この画像辞書902に基づいて再現される入力画像において、文字画像が置換されることになる。
図10は、画像操作プログラム7による文字置換処理(S50)を示すフローチャートである。
図10に示すように、ステップ500(S500)において、利用者は、UI装置26(図3)を用いて、操作対象となる画像データのデータファイル(画像辞書及び文字対応テーブルが含まれたもの)を選択し、置換内容(置換前の文字及び置換後の文字)を指示する。
画像操作プログラム7におけるデータ取得部700(図8)は、利用者により選択されたデータファイルを記録装置24(図3)等から読み出して記憶部710に対して出力する。
記憶部710は、データ取得部700から入力されたデータファイル(入力画像の符号データ、画像辞書902のデータ、及び、文字対応テーブル904のデータ)をメモリ204(図3)に格納する。
文字置換処理部730は、メモリ204に記憶されたデータファイルの中から、文字対応テーブル904を取り出す。
ステップ502(S502)において、文字置換処理部730は、文字対応テーブル904を参照して、置換前の文字として指定された文字の文字コードに対応するインデクスを検索する。
ステップ504(S504)において、画像操作プログラム7は、置換前の文字の文字コードに対応するインデクスが発見された場合に、S506の処理に移行し、この文字コードに対応するインデクスが発見されなかった場合に、置換対象となる文字画像が入力画像に存在しない旨をUI装置26に表示して文字置換処理50を終了する。
ステップ506(S506)において、文字置換処理部730は、文字対応テーブル904を参照して、置換後の文字として指定された文字の文字コードに対応するインデクスを検索する。
画像操作プログラム7は、置換後の文字の文字コードに対応するインデクスが発見された場合に、S512の処理に移行し、置換後の文字の文字コードに対応するインデクスが発見されなかった場合に、S508の処理に移行する。すなわち、画像操作プログラム7は、置換後の文字に対応する画像パターンが画像辞書902に登録されている場合には、この画像パターンのデータを用いて置換処理を行い、置換後の文字に対応する画像パターンが画像辞書902に登録されていない場合には、置換後の文字画像のデータを作成する。
ステップ508(S508)において、文字置換処理部730は、置換後の文字の文字コードに対応するインデクスが発見されなかった場合に、置換後の文字として指定された文字画像を作成する。例えば、文字置換処理部730は、フォントラスタライザなどを用いて置換後の文字画像のデータを作成する。
ステップ510(S510)において、文字置換処理部730は、作成された文字画像データ(置換後の文字画像)を、他の画像パターンと同一の符号化方式により符号化する。
ステップ512(S512)において、文字置換処理部730は、置換後の文字の文字コードに対応するインデクスが発見された場合に、このインデクスに対応する画像パターンの符号データを画像辞書902から抽出する。
ステップ514(S514)において、文字置換処理部730は、置換前の文字の文字コードに対応するインデクスに基づいて、画像辞書902のエントリを更新する。具体的には、文字置換処理部730は、置換前の文字に対応するインデクスに対応する画像パターンを、置換後の文字画像の符号データと置換する。
以上説明したように、第1の実施形態における画像処理装置2は、入力画像に含まれる文字画像に基づいて画像辞書902を作成し、この画像辞書902により入力画像を符号化することにより、入力画像の再現性を高めることができる。また、本画像処理装置2は、画像辞書902に登録された画像パターンと、それぞれの画像パターンが表す文字の文字コードとを互いに対応付けることにより、入力画像の符号データを復号化することなく、入力画像に含まれる文字画像の検索処理及び置換処理を行うことができる。
[第2実施形態]
次に、第2の実施形態を説明する。上記第1の実施形態における画像処理装置2は、画像辞書902に登録された画像パターンと文字コードとを互いに対応付けていたが、第2の実施形態における画像処理装置2は、画像辞書902に登録された画像パターンと、文字コード及びフォント情報の組合せとを互いに対応付ける。ここで、フォント情報とは、フォント画像に関する情報であり、例えば、フォントの種類、フォントサイズ、及び、フォントの色等である。
本実施形態における画像処理装置2は、文字コード及びフォント情報の組合せと、画像パターンとを互いに対応付けることにより、フォントの種類の変更、文字画像の拡大処理、文字画像の縮小処理、及び、文字画像の変形処理等を行うことができる。
図11は、第2の文字対応テーブル906を例示する図である。
図11に例示するように、第2の実施形態における画像処理装置2は、文字コード、フォント種類及びフォントサイズの組合せと、画像パターンに付与されたインデクスとを互いに対応付ける第2の文字対応テーブル906を作成する。文字対応テーブル906に登録されるフォント種類は、フォント画像の形状を規定する情報であり、例えば、ゴシック体、イタリック体又は明朝体などである。また、文字対応テーブル906に登録されるフォントサイズは、フォント画像の大きさを規定する情報である。
これにより、画像処理装置2は、文字コードだけでなく、フォント種類及びフォントサイズを指定して検索処理及び置換処理を行うことができる。また、画像処理装置2は、予め用意された種々のフォント画像を用いることにより、フォント種類の変更、フォントサイズの変更(文字画像の拡大又は縮小)、及び、文字画像の変形を行うことができる。
図12は、第2の画像操作プログラム72の機能構成を説明する図である。なお、本図に示す各構成のうち、図8に示された構成と実質的に同一のものには同一の符号が付されている。
図12に示すように、第2の画像操作プログラム72は、第1の画像操作プログラム7(図8)の各構成に加えて、フォント提供部760、フォントデータベース(フォントDB)762、フォント変更部770、拡縮処理部780及び変形処理部790を有する。
フォント提供部760は、フォントDB762に記憶されたフォント画像を、フォント変更部770、拡縮処理部780又は変形処理部790等に提供する。具体的には、フォントDB762は、文字コード、フォント種類及びフォントサイズに対応付けて、この文字コードに対応するフォント画像(ラスタライズされた文字画像のデータ)を予め記憶している。フォント提供部760は、フォント変更部770、拡縮処理部780又は変形処理部790等からの要求に応じて、フォントDB762に記憶されているフォント画像の中から、要求されたフォント画像を選択し、選択したフォント画像を記憶部500に記憶する。
フォント変更部770は、利用者の要求に応じて、入力画像に含まれる文字画像のフォント種類を変更する。具体的には、利用者がフォント種類を変更すべき文字画像(例えば、文字コード、フォント種類又はフォントサイズ等により指定される)と所望のフォント種類とを指定すると、フォント変更部770は、文字コード等に基づいて、フォント種類を変更すべき文字画像に対応するインデクスを文字対応テーブル906から読み出し、画像辞書902を参照して、読み出されたインデクスに対応する画像パターンを特定する。そして、フォント変更部770は、指定されたフォント種類に対応するフォント画像をフォントDB762から読み出し、特定された画像パターンを、フォントDB762から読み出されたフォント画像のデータと置換する。
拡縮処理部780は、利用者の要求に応じて、入力画像に含まれる文字画像のフォントサイズを変更する。具体的には、利用者がフォントサイズを変更すべき文字画像(例えば、文字コード、フォント種類又はフォントサイズ等により指定される)と所望のフォントサイズとを指定すると、拡縮処理部780は、文字コード等に基づいて、フォント種類を変更すべき文字画像に対応するインデクスを文字対応テーブル906から読み出し、画像辞書902を参照して、読み出されたインデクスに対応する画像パターンを特定し、特定された画像パターンの大きさを変更する。例えば、拡縮処理部780は、指定されたフォントサイズのフォント画像をフォントDB762から読み出し、特定された画像パターンを、フォントDB762から読み出されたフォント画像のデータと置換することにより、画像パターンの大きさを変更する。なお、拡縮処理部780は、特定された画像パターンの大きさを最近傍法又は線形補間法などにより変更してもよい。
変形処理部790は、利用者の要求に応じて、入力画像に含まれる文字画像の形状を変更する。具体的には、利用者が文字形状を変更すべき文字画像(例えば、文字コード、フォント種類又はフォントサイズ等により指定される)と所望の変形処理とを指定すると、変形処理部790は、文字コード等に基づいて、文字形状を変更すべき文字画像に対応するインデクスを文字対応テーブル906から読み出し、画像辞書902を参照して、読み出されたインデクスに対応する画像パターンを特定する。そして、変形処理部790は、指定された変形処理に応じて、特定された画像パターンに対して画像変換処理(回転、アフィン変換又は射影変換など)を施す。
なお、変形処理部790は、フォントDB762から読み出されたフォント画像に対して画像変換処理を施し、特定された画像パターンをこの画像変換処理が施されたフォント画像のデータと置換することにより、画像パターンに対する画像変換処理を実現してもよい。
図13は、拡縮・フォント変更処理の動作(S52)を示すフローチャートである。なお、本図に示された各処理のうち、図10に示された処理と実質的に同一のものには同一の符号が付されている。
図13に示すように、S500において、利用者は、UI装置26(図3)を用いて、操作対象となる画像データのデータファイル(画像辞書及び文字対応テーブルが含まれたもの)を選択し、操作対象となる文字画像及び操作内容(拡縮処理又はフォント変更処理)を指示する。
画像操作プログラム72におけるデータ取得部700(図12)は、利用者により選択されたデータファイルを記録装置24(図3)等から読み出して記憶部710に対して出力して、入力画像の符号データ、画像辞書902のデータ及び文字対応テーブル906のデータをメモリ204(図3)に格納する。
S502において、画像操作プログラム72は、文字対応テーブル906を参照して、操作対象として指定された文字画像に対応するインデクスを文字コード及びフォント種類等に基づいて検索する。
ステップ520(S520)において、画像操作プログラム72は、操作対象として指定された文字画像に対応するインデクスが発見された場合に、S522の処理に移行し、指定された文字画像に対応するインデクスが発見されなかった場合に、操作対象となる文字画像が入力画像に存在しない旨のエラー表示を行って拡縮・フォント変更処理52を終了する。
ステップ522(S522)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、指定された画像操作(フォント種類の変更又は拡縮処理等)がなされた後の文字画像と同一又は酷似する画像パターンが画像辞書902に登録されているか否かを検索する。具体的には、画像操作プログラム72は、操作対象として指定された文字画像の文字コードと、操作内容に対応したフォント種類(すなわち、変更後のフォント種類)及びフォントサイズ(すなわち、拡縮処理後のフォントサイズ)とに対応するインデクスを文字対応テーブル906内で検索する。
画像操作プログラム72は、文字コード、フォント種類及びフォントサイズに対応するインデクスが文字対応テーブル906に存在する場合に、S524の処理に移行し、対応するインデクスが文字対応テーブル906に存在しない場合に、S528の処理に移行する。
ステップ524(S524)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、文字対応テーブル906で発見されたインデクスに基づいて、画像辞書902から画像パターンの符号データを画像操作後の符号データとして読み出す。すなわち、画像操作プログラム72は、操作対象として指定された文字画像に対して利用者から指定された画像操作(拡縮又はフォント変更など)が施された場合に生成される文字画像の符号データが画像辞書902内に存在する場合に、この符号データを画像操作処理後の画像データとして画像辞書902から読み出す。
ステップ526(S526)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、画像操作後の文字画像と同一又は酷似する画像パターンが画像辞書902に登録されていない場合に、指定された画像操作がなされた後の文字画像と同一又は酷似する画像パターンをフォント画像に基づいて作成する。具体的には、画像操作プログラム72(フォント提供部760)は、操作対象として指定された文字画像の文字コードと、操作内容に対応したフォント種類(すなわち、変更後のフォント種類)及びフォントサイズ(すなわち、拡縮処理後のフォントサイズ)とに対応するフォント画像をフォントDB762から読み出す。
なお、画像操作プログラム72(変形処理部790)は、フォントDB762から読み出されたフォント画像に対して、回転処理、アフィン変換処理又は射影変換処理を行って、フォント画像を所望の形状に変形させてもよい。
ステップ528(S528)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、フォントDB762から読み出されたフォント画像のデータを、画像パターンに適用された符号化方式で符号化して画像操作後の符号データとする。
ステップ530(S530)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、入力画像の符号データに含まれる位置情報(操作対象の文字画像に関するもの)を、操作内容に応じて補正する。すなわち、画像操作プログラム72は、フォント変更処理又は拡縮処理により文字画像の範囲が変化するため、これに応じて文字画像の位置情報を補正する。
ステップ532(S532)において、画像操作プログラム72(フォント変更部770又は拡縮処理部780)は、操作対象として指定された文字画像に対応する画像パターンの符号データを、画像操作後の符号データと置換する。例えば、画像操作プログラム72は、画像辞書902から画像操作後の符号データが読み出された場合に、S520において発見されたインデクスに対応する画像パターンの符号データを、この画像操作後の符号データと置換する。また、画像操作プログラム72は、フォント画像に基づいて画像操作後の符号データが作成された場合に、S520において発見されたインデクスに対応する画像パターンの符号データを、作成された画像操作後の符号データと置換する。
以上説明したように、第2の実施形態における画像処理装置2は、画像辞書902に登録された画像パターンと、それぞれの画像パターンが表す文字画像の文字コード及びフォント情報とを互いに対応付けることにより、入力画像の符号データを復号化することなく、入力画像に含まれる文字画像のフォント変更処理及び拡縮処理等を行うことができる。
[変形例]
次に、上記実施形態の変形例を説明する。
上記実施形態では、画像辞書作成部50は、逐次的に入力画像から文字画像を切り出し、切り出された文字画像に基づいて順次画像辞書を作成していたが、これに限定されるものではなく、例えば、1ページ又は1ドキュメントなどの入力画像全体に基づいて、画像辞書を作成してもよい。また、画像辞書作成部50は、入力画像において形態が互いに類似する複数の文字画像を選択し、選択された複数の文字画像に基づいて画像辞書902に登録すべき画像パターンを作成してもよい。
そこで、第1の変形例における画像辞書作成装置50は、入力画像から切り出された文字画像を文字コード又は文字コードとフォント情報との組合せに基づいて分類し、分類された文字画像を出現頻度に応じて統合して、画像辞書に登録すべき画像パターンを作成する。なお、同一の文字コードで分類された文字画像から複数の画像パターンが作成されてもよい。
これにより、画像辞書作成部50は、文字画像の出現頻度などを加味して画像辞書902を作成することができるため、可読性に対する影響を抑えつつ高い圧縮率を実現できる。
図14は、第1の変形例における画像パターン作成処理を模式的に説明する図である。なお、本図では、2値の入力画像が入力され、この入力画像から切り出された文字画像が文字コードで分類される形態を具体例として説明する。
図14に示すように、画像辞書作成部50は、文字コードに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、それぞれの文字画像群について黒画素の分布確率Q’(x)を算出する。算出された分布確率Q’(x)は、図14に例示するように、画素位置xによって異なる数値を示す。これは、分類された文字画像群の中に、形状の異なる文字画像が異なる出現頻度で混在しているからである。
分布確率Q’(x)は、以下の式により算出される。
Q(x)=P(1,x)+P(2,x−v2)+・・・+P(i−1,x−v(i−1))
Q’(x)=Q(x)/N
Q(x):分類された文字画像群の画素分布、P(i,x):各文字画像の黒画素分布、x:位置ベクトル、i:文字画像群に属する各文字画像(1〜N:Nは文字画像群に属する文字画像の数)
なお、i=1の場合には、Q(x)=P(1,x)となる。
次に、画像辞書作成部50は、分布確率Q’(x)に対して閾値処理を施して出現頻度が高い類型的な形状(和結合パターンQ”(x))を抽出する。すなわち、分布確率Q’(x)は、閾値Bで閾値処理がなされることにより、出現頻度が低い文字画像の差分形状(出現頻度の高い類型的な形状との差分)及びノイズ部分等が排除されて、類型的な形状のみが抽出される。
なお、和結合パターンQ”(x)は、以下の条件式により算出される。
Q’(x)>閾値Bの場合に、Q”(x)=1
上記以外の場合に、Q”(x)=0
画像辞書作成部50は、続いて、抽出された和結合パターンQ”(x)と、文字画像群に属する各文字画像との共通部分を、画像辞書に登録すべき画像パターンとして抽出する。すなわち、画像辞書作成部50は、和結合パターンQ”(x)と、各文字画像の画素分布P(i,x−vi)とを積演算する。これにより、文字画像群の中に複数存在する類型的な文字画像(出現頻度の高いもの)の画像パターン#1及び画像パターン#2が抽出される。
次に、第2の変形例を説明する。
第2の変形例における画像辞書作成部50は、入力画像から切り出された文字画像を文字コード又は文字コードとフォント情報との組合せに基づいて分類し、分類された文字画像とそれらの出現頻度とに基づいて、分類された文字画像群における共通形状及び差分形状を抽出し、抽出された共通形状及び差分形状を階層化して画像辞書902に登録する。ここで、共通形状とは、文字コード等で分類された文字画像群に共通して存在する形状であり、差分形状とは、この文字画像群に属する各文字画像と共通形状との差分であって、出現頻度が基準値以上であるものをいう。
図15は、第2の変形例における画像パターン作成処理を模式的に説明する図である。なお、本図では、2値の入力画像が入力され、この入力画像から切り出された文字画像が文字コードで分類される形態を具体例として説明する。
まず、画像辞書作成部50は、第1の変形例と同様に、文字コードに基づいて入力画像に含まれる文字画像を複数の文字画像群に分類し、それぞれの文字画像群について黒画素の分布確率Q’(x)を算出する。算出された分布確率Q’(x)は、図15に示すように、画素位置xによって異なる数値を示す。このうち、分布確率が最も高い部分は、この文字画像群に属する文字画像に共通する形状(すなわち、共通形状)であると考えられる。そして、分布確率が存在する他の領域は、それぞれの文字画像と共通形状との差分に相当する形状(すなわち、差分形状)であると考えられる。
画像辞書作成部50は、共通形状(分布確率がほぼ最大となる領域)を抽出するための第1レベル閾値と、出現頻度の高い差分形状を抽出するための第2レベル閾値とを有している。
まず、画像辞書作成部50は、分布確率Q’(x)に対して第1レベル閾値により閾値処理を行い、第1レベルパターン(共通形状)に相当する部分を抽出する。次に、分布確率Q’(x)から、抽出された第1レベルパターンに相当する部分が除去されて、第2レベル閾値を基準として「1」又は「0」に変換されることにより、第2レベル和結合パターンQ1”(x)が生成される。
画像辞書作成部50は、この第2レベル和結合パターンQ1”(x)と、各文字画像iの画素分布P(i,x)とを積演算することにより、これらの共通部分である第2レベルパターンを抽出する。本例では、第2レベル和結合パターンQ1”(x)と「文字画像#1」との共通部分は、第2レベルパターンaとなり、第2レベル和結合パターンQ1”(x)と「文字画像#2」との共通部分は、第2レベルパターンbとなる。
これにより、「文字画像#1」は、第1レベルパターンと第2レベルパターンaとの和としてそれぞれのインデクスに置換でき、「文字画像#2」は、第1レベルパターンと第2レベルパターンbとの和としてインデクスに置換できる。
図16は、第2の変形例において作成される第3の文字対応テーブル908を例示する図である。
第2の変形例では、1つの文字画像に対して、共通形状に相当する画像パターン(第1レベルパターン)と、差分形状に相当する画像パターン(第2レベルパターン)とが生成されており、それぞれの画像パターンにインデクスが付与されている。そこで、第2の変形例におけるテーブル生成部570(図5)は、図16に例示するように、1組の文字コード及びフォント情報に対して複数のインデクスが対応付けられた第3の文字対応テーブル908を作成する。
これにより、文字コードが同一であってもフォント種類の相違によって文字画像の形状が異なる場合(例えば、ゴシック体の「Q」と明朝体の「Q」)もあるが、これらの相違は差分形状に相当する画像パターン(第2レベルパターン)により再現可能となる。
(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。 (A)は、画像辞書902を例示し、(B)は、文字対応テーブル904を例示し、(C)は、この画像辞書902に基づいて再現される入力画像を例示する図である。 本発明にかかる画像処理方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。 制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する符号化プログラム5の機能構成を例示する図である。 画像辞書作成部50の機能をより詳細に説明する図である。 符号化部60の機能をより詳細に説明する図である。 第1の実施形態における符号化プログラム5の動作(S10)を示すフローチャートである。 制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する第1の画像操作プログラム7の機能構成を例示する図である。 文字置換処理の概略を説明する図である。 画像操作プログラム7による文字置換処理(S50)を示すフローチャートである。 第2の文字対応テーブル906を例示する図である。 第2の画像操作プログラム72の機能構成を説明する図である。 拡縮・フォント変更処理の動作(S52)を示すフローチャートである。 第1の変形例における画像パターン作成処理を模式的に説明する図である。 第2の変形例における画像パターン作成処理を模式的に説明する図である。 第2の変形例において作成される第3の文字対応テーブル908を例示する図である。
符号の説明
2・・・画像処理装置
5・・・符号化プログラム
40・・・画像入力部
410・・・文字認識部
420・・・PDLデコンポーザ
50・・・画像辞書作成部
510・・・文字画像抽出部
520・・・一致判定部
530・・・辞書決定部
540・・・位置補正部
550・・・インデクス付与部
560・・・登録制御部
570・・・テーブル生成部
60・・・符号化部
610・・・パターン判定部
620・・・位置情報符号化部
630・・・インデクス符号化部
640・・・画像符号化部
650・・・辞書符号化部
660・・・選択部
670・・・符号出力部
7・・・画像操作プログラム
700・・・データ取得部
710・・・記憶部
720・・・文字検索処理部
730・・・文字置換処理部
740・・・復号化処理部
750・・・画像出力部
760・・・フォント提供部
762・・・フォントデータベース
770・・・フォント変更部
780・・・拡縮処理部
790・・・変形処理部

Claims (11)

  1. 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定する類型決定手段と、
    前記類型決定手段により決定された画像パターンに基づいて、入力画像の画像データを圧縮する圧縮手段と、
    少なくとも、前記類型決定手段により決定された画像パターンと、文字識別情報とを互いに対応付ける対応付け手段と
    を有する画像処理装置。
  2. 前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与する識別情報付与手段
    をさらに有し、
    前記圧縮手段は、入力画像に含まれる文字画像を、対応する画像パターンに付与されたパターン識別情報と置換することにより、入力画像の画像データを圧縮し、
    前記対応付け手段は、前記識別情報付与手段により付与されたパターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを生成することにより、画像パターンと文字識別情報とを互いに対応付ける
    請求項1に記載の画像処理装置。
  3. 前記類型決定手段により決定された画像パターンの画像データを符号化するパターン符号化手段
    をさらに有し、
    少なくとも、前記対応付け手段により生成された文字対応テーブルと、前記パターン符号化手段により符号化された画像パターンとを出力する出力手段と
    をさらに有する請求項2に記載の画像処理装置。
  4. 入力画像に含まれる文字画像それぞれが表す文字の文字識別情報を取得する情報取得手段
    をさらに有し、
    前記対応付け手段は、前記情報取得手段により取得された文字識別情報と、この文字識別情報に対応する文字画像に基づいて決定された画像パターンとを互いに対応付ける
    請求項1に記載の画像処理装置。
  5. 前記情報取得手段は、入力画像に含まれる文字画像のフォント情報をさらに取得し、
    前記対応付け手段は、前記情報取得手段により取得された文字識別情報及びフォント情報と、画像パターンとを互いに対応付ける
    請求項4に記載の画像処理装置。
  6. 文字画像を構成する類型的な画像パターンとこの画像パターンそれぞれを識別するパターン識別情報とを互いに対応付ける画像辞書テーブル、この画像辞書テーブルに基づいて符号化された対象画像、及び、パターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを取得するデータ取得手段と、
    前記データ取得手段により取得された文字対応テーブルを用いて、対象画像に含まれる文字画像を操作する画像操作手段と
    を有する画像処理装置。
  7. 前記画像操作手段は、前記文字対応テーブルにより互いに対応付けられた文字識別情報及びパターン識別情報に基づいて、対象画像に含まれる文字画像の検索処理又は置換処理を行う
    請求項6に記載の画像処理装置。
  8. 前記文字対応テーブルは、さらに、画像パターンそれぞれに対応するフォント情報を前記パターン識別情報に対応付け、
    前記データ取得手段は、前記画像辞書テーブル、符号化された対象画像、及び、パターン識別情報を文字識別情報とフォント情報とに対応付ける文字対応テーブルを取得し、
    前記画像操作手段は、文字対応テーブルによりパターン識別情報と対応付けられたフォント情報に基づいて、対象画像に含まれる文字画像に対してフォントの変更処理又は拡縮処理を行う
    請求項6に記載の画像処理装置。
  9. 対象画像に基づいて生成された画像パターンのデータと、
    この画像パターンに基づいて圧縮された対象画像のデータと、
    この画像パターンと文字識別情報とを互いに対応付ける文字対応テーブルと
    を有するデータファイル。
  10. 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定し、
    決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与し、
    決定された画像パターン及びこれらの画像パターンに付与されたパターン識別情報に基づいて、入力画像に含まれる文字画像をパターン識別情報に置換して、入力画像の画像データを圧縮し、
    それぞれの画像パターンに付与されたパターン識別情報と文字識別情報とを互いに対応付け、
    互いに対応付けられたパターン識別情報及び文字識別情報を用いて、圧縮された入力画像に対して文字画像の操作を行う
    画像処理方法。
  11. 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定するステップと、
    決定された画像パターンに基づいて入力画像の画像データを圧縮するステップと、
    少なくとも、決定された画像パターンと文字識別情報とを互いに対応付けて出力するステップと
    をコンピュータに実行させるプログラム。
JP2004139763A 2004-05-10 2004-05-10 画像処理装置、データファイル、画像処理方法及びそのプログラム Pending JP2005323169A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004139763A JP2005323169A (ja) 2004-05-10 2004-05-10 画像処理装置、データファイル、画像処理方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004139763A JP2005323169A (ja) 2004-05-10 2004-05-10 画像処理装置、データファイル、画像処理方法及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2005323169A true JP2005323169A (ja) 2005-11-17

Family

ID=35470103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004139763A Pending JP2005323169A (ja) 2004-05-10 2004-05-10 画像処理装置、データファイル、画像処理方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2005323169A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
JP2009099025A (ja) * 2007-10-18 2009-05-07 Nec Corp パスワード発行方法と携帯端末とパスワード認証方法
JP2009213145A (ja) * 2007-02-21 2009-09-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2020013217A (ja) * 2018-07-13 2020-01-23 株式会社リコー 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009213145A (ja) * 2007-02-21 2009-09-17 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP4553055B2 (ja) * 2007-02-21 2010-09-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2008219825A (ja) * 2007-03-08 2008-09-18 Fuji Xerox Co Ltd 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム
JP2009099025A (ja) * 2007-10-18 2009-05-07 Nec Corp パスワード発行方法と携帯端末とパスワード認証方法
JP2020013217A (ja) * 2018-07-13 2020-01-23 株式会社リコー 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US8411955B2 (en) Image processing apparatus, image processing method and computer-readable medium
US7391917B2 (en) Image processing method
US7349577B2 (en) Image processing method and image processing system
JP3796500B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4393161B2 (ja) 画像処理装置及び画像処理方法
US20010016067A1 (en) Apparatus and methodology for submitting search oueries
JP4510535B2 (ja) 画像処理装置及びその制御方法、プログラム
JP3997198B2 (ja) 画像処理システム及び画像処理方法
JP3862694B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2008109394A (ja) 画像処理装置及びその方法、プログラム
US20050226516A1 (en) Image dictionary creating apparatus and method
JP2006023940A (ja) 画像処理システム及び画像処理方法
JP4338189B2 (ja) 画像処理システム及び画像処理方法
US20060182358A1 (en) Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof
JP2005323169A (ja) 画像処理装置、データファイル、画像処理方法及びそのプログラム
JP2005352735A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
CN100501728C (zh) 图像处理方法、系统、程序、程序存储介质以及信息处理设备
JP4645058B2 (ja) 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
JP2005149210A (ja) 画像処理装置及びその制御方法、プログラム
JP2005352734A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JP2005352736A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JP2005174227A (ja) 画像処理装置及びその制御方法、プログラム
JP4753007B2 (ja) 画像符号化装置、画像復号化装置及びこれらのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090616