JP2005323169A - 画像処理装置、データファイル、画像処理方法及びそのプログラム - Google Patents
画像処理装置、データファイル、画像処理方法及びそのプログラム Download PDFInfo
- Publication number
- JP2005323169A JP2005323169A JP2004139763A JP2004139763A JP2005323169A JP 2005323169 A JP2005323169 A JP 2005323169A JP 2004139763 A JP2004139763 A JP 2004139763A JP 2004139763 A JP2004139763 A JP 2004139763A JP 2005323169 A JP2005323169 A JP 2005323169A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- pattern
- identification information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 画像処理装置2は、入力画像に基づいて画像辞書902に登録すべき画像パターンを決定し、決定された画像パターンに対してインデクスを付与し、入力画像に含まれる文字画像を同一又は近似する画像パターンのインデクスと置換して入力画像の画像データを圧縮する。さらに、画像処理装置2は、それぞれの画像パターンに付与されたインデクスと、それぞれの画像パターンに対応する文字の文字コードとを互いに対応付ける文字対応テーブル904を作成する。画像処理装置2は、この文字対応テーブル904により対応付けられたインデクス及び文字コードを用いて、圧縮された入力画像に対して文字検索又は文字置換等の画像操作を行う。
【選択図】図9
Description
上記目的を達成するために、本発明にかかる画像処理装置は、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定する類型決定手段と、前記類型決定手段により決定された画像パターンに基づいて、入力画像の画像データを圧縮する圧縮手段と、少なくとも、前記類型決定手段により決定された画像パターンと、文字識別情報とを互いに対応付ける対応付け手段とを有する。
また、本発明にかかるデータファイルは、対象画像に基づいて生成された画像パターンのデータと、この画像パターンに基づいて圧縮された対象画像のデータと、この画像パターンと文字識別情報とを互いに対応付ける文字対応テーブルとを有する。
また、本発明にかかる画像処理方法は、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定し、決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与し、決定された画像パターン及びこれらの画像パターンに付与されたパターン識別情報に基づいて、入力画像に含まれる文字画像をパターン識別情報に置換して、入力画像の画像データを圧縮し、それぞれの画像パターンに付与されたパターン識別情報と文字識別情報とを互いに対応付け、互いに対応付けられたパターン識別情報及び文字識別情報を用いて、圧縮された入力画像に対して文字画像の操作を行う。
また、本発明にかかるプログラムは、入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定するステップと、決定された画像パターンに基づいて入力画像の画像データを圧縮するステップと、少なくとも、決定された画像パターンと文字識別情報とを互いに対応付けて出力するステップとをコンピュータに実行させる。
まず、本発明の理解を助けるために、その背景及び概略を説明する。
画像処理装置2は、例えば、入力画像に含まれる文字画像そのものを符号化する替わりに、それぞれの文字画像の識別情報とその出現位置等とを符号化することにより、高い圧縮率を実現することができる。
図1(A)は、共通のフォントデータベースが存在することを前提とした符号化方法を説明し、図1(B)は、画像辞書の添付を前提とした符号化方法を説明する図である。
図1(A)に示すように、文字画像を識別情報(文字コード、フォントの種類及びフォントサイズ等)に対応付けて記憶する共通のフォントデータベースが符号化側及び復号化側の両方に存在する場合には、符号化側の画像処理装置は、入力画像に含まれる文字画像の替わりに、文字画像の識別情報(文字コード、フォントの種類及びフォントサイズ等)と、文字画像の出現位置とを符号化することにより、高い圧縮率で画像データを圧縮し復号化側の画像処理装置に送信することができる。
この場合に、復号化側の画像処理装置は、受信した符号データ(文字コード、フォントの種類及びフォントサイズ)を復号化し、復号化された文字コード、フォントの種類及びフォントサイズ、並びに、フォントデータベースに登録されているフォント画像に基づいて文字画像を生成して入力画像を再現する。また、復号化側の画像処理装置は、復号化された文字コード、フォントの種類及びフォントサイズ等を用いることにより、画像全体を再現することなく、入力画像に含まれている文字画像の検索及び置換などを行うことができる。
しかしながら、フォントデータベースの存在を前提とした符号化方法では、符号化側及び復号化側でフォントデータベースをそれぞれ設ける必要があり、記憶領域がフォントデータベースにより圧迫される。また、符号化側のフォントデータベースが更新されると、これに応じて復号化側のフォントデータベースも符号化側と同一内容になるよう更新する必要がある。また、復号時には、フォントデータベースに基づいてフォント画像を生成する必要がある。
復号化側の画像処理装置2は、インデクス及び出現位置を復号化し、復号化されたインデクスに対応する画像パターンを画像辞書から選択し、選択された画像パターンを復号化された出現位置に配置して入力画像を再現する。
このように、本実施形態における画像処理装置2は、入力画像に基づいて画像辞書を作成し送受信することにより、共通のデータベースを前提とすることなく高い圧縮率を実現することができる。また、フォントデータベースを符号化側及び復号化側で同期させる必要がない。なお、符号量を低減させるためには、画像辞書も符号化されることが望ましい。
本実施形態における画像処理装置2は、画像操作を実現するために、画像パターンと、これら画像パターンに対応する文字を識別するための文字識別情報とを互いに対応付ける。より具体的には、符号化側の画像処理装置2は、入力画像に基づいて生成された画像パターンと、これら画像パターンに対応する文字識別情報とを互いに対応付ける文字対応テーブルを作成し、作成された文字対応テーブルを符号データと共に復号化側の画像処理装置2に送信する。
復号化側の画像処理装置2は、受信した文字対応テーブルに基づいて、入力画像に含まれる文字画像に対して、検索処理などの画像操作を行うことができる。
図2(A)に例示するように、画像辞書902には、入力画像に含まれる複数の画像パターンと、この画像パターンを識別するために付与されたインデクス(パターン識別情報)とが含まれている。画像パターンは、入力画像に含まれる部分的な画像データであり、ラスタライズされた画像データであることが望ましい。本例の画像パターンは、入力画像(2値)中に既定回数以上(複数回)出現する類型的なパターン(2値データ)である。また、インデクスは、例えば、入力画像毎に個別に生成される識別情報であり、入力画像から画像パターンが抽出される順番でその画像パターンに付与されるシリアル番号等であってもよい。
図2(B)に例示するように、文字対応テーブル904には、画像辞書902に登録されているインデクスと、それぞれのインデクスに対応する文字コードとが含まれている。文字コードは、インデクスに対応する画像パターンが表す文字を識別する文字識別情報の一例であり、それぞれの画像パターンに対応する文字のコードである。すなわち、本例では、インデクスを介して画像パターンと文字コードとが互いに対応付けられている。なお、画像パターンは文字コード(文字識別情報)と直接対応付けられてもよい。
このように、本実施形態における画像処理装置2は、文字コード(文字識別情報)と画像パターンとを互いに対応付けることにより、入力画像の符号データを復号化して再現することなく、文字検索及び文字置換などの画像操作を行うことができる。
次に、画像処理装置2のハードウェア構成を説明する。
図3は、本発明にかかる画像処理方法が適応される画像処理装置2のハードウェア構成を、制御装置20を中心に例示する図である。
図3に例示するように、画像処理装置2は、CPU202及びメモリ204などを含む制御装置20、通信装置22、HDD・CD装置などの記録装置24、並びに、LCD表示装置あるいはCRT表示装置およびキーボード・タッチパネルなどを含むユーザインターフェース装置(UI装置)26から構成される。
画像処理装置2は、例えば、符号化プログラム5(後述)及び画像操作プログラム7(後述)の少なくとも一方がプリンタドライバの一部としてインストールされた汎用コンピュータであり、通信装置22又は記録装置24などを介して画像データを取得し、取得された画像データを符号化してプリンタ装置10に送信する。また、画像処理装置2は、プリンタ装置10のスキャナ機能より光学的に読み取られた画像データを取得し、取得された画像データを符号化する。
図4は、制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する符号化プログラム5の機能構成を例示する図である。
図4に例示するように、符号化プログラム5は、画像入力部40、画像辞書作成部50及び符号化部60を有する。
符号化プログラム5において、画像入力部40は、プリンタ装置10のスキャナ機能により読み取られた画像データ、又は、通信装置22又は記録装置24などを介して取得されたPDL(Page Discription Language)形式の画像データを取得し、取得された画像データをラスタデータに変換して画像辞書作成部50に出力する。また、画像入力部40は、光学的に読み取られた画像データ等から文字画像を認識する文字認識部410と、PDL形式の画像データを解釈してラスタデータを生成するPDLデコンポーザ420とを有する。
文字認識部410(情報取得手段)は、入力されたスキャン画像の画像データ(以下、入力画像)に含まれる文字を認識し、認識された文字の文字識別情報、及び、認識された文字の文字領域情報を文字認識処理の結果として画像辞書作成部50に対して出力する。ここで、文字識別情報とは、文字を識別する情報であり、例えば、汎用性のある文字コード(ASCIIコード又はシフトJISコードなど)である。また、文字領域情報とは、入力画像における文字画像の領域を示す情報であり、例えば、文字画像の位置、大きさ、範囲又はこれらの組合せからなる文字のレイアウト情報である。なお、文字認識部410は、認識された文字コードに属するフォント画像と、文字画像とを比較することにより、入力画像に含まれる文字画像のフォント情報を判別してもよい。ここで、フォント情報とは、フォント画像の形状、大きさ又は色等を規定する情報であり、フォントの種類(ゴシック、イタリック又は明朝など)、フォントサイズ(ポイント数)、及び、フォントの色などが含まれる。
PDLデコンポーザ420(情報取得手段)は、PDL形式の画像データを解釈してラスタライズされた画像データ(ラスタデータ)を生成し、生成された画像データと共に、生成された画像データにおける文字画像の文字識別情報、フォント情報及び文字領域情報を画像辞書作成部50に対して出力する。
また画像辞書作成部50は、画像パターンに付与されたインデクスと、この画像パターンに対応する文字の文字識別情報とを互いに対応付ける文字対応テーブル904を作成し、符号化部60に対して出力する。
また、符号化部60は、画像辞書作成部50から入力された文字対応テーブル904を、入力画像の符号データと対応付ける。
図5に示すように、画像辞書作成部50は、記憶部500、文字画像抽出部510、一致判定部520、辞書決定部530、位置補正部540、インデクス付与部550、登録制御部560及びテーブル生成部570を有する。記憶部500は、メモリ204(図3)及び記録装置24(図3)を制御して、画像入力部40(図4)から入力された入力画像、文字識別情報及び文字領域情報を記憶する。なお、以下、文字コードを文字識別情報の具体例とし、文字の位置情報を文字領域情報の具体例として説明する。
また、一致判定部520は、入力画像から切り出された文字画像と、画像辞書902に登録された画像パターンとを複数の相対位置で比較して一致度合いを判定する。すなわち、一致判定部520は、最大の一致度合いを算出するために、新たに切り出された文字画像と、画像辞書902に登録された画像パターンとを、これらの相対位置を変更しながら(ずらしながら)比較する。
例えば、一致判定部520は、入力画像から切り出された文字画像と、この文字画像と文字コードが一致する画像パターンとを互いにずらしながら一致画素率を算出し、一致画素率の最大値及びこの最大となったときのずらしベクトルを記憶部500に出力する。
インデクス付与部550は、入力画像に基づいて決定された画像パターンに対して、これらの画像パターンを識別するインデクスを付与し、付与されたインデクスと画像パターンとを対応付けて記憶部500に出力する。
図6に示すように、符号化部60は、パターン判定部610、位置情報符号化部620、インデクス符号化部630、画像符号化部640、辞書符号化部650、選択部660及び符号出力部670を有する。
パターン判定部610は、画像辞書に登録された画像パターンそれぞれと、入力画像に含まれる部分画像とを比較して、この部分画像と対応する画像パターン(同一又は類似の画像パターン)を判定する。具体的には、パターン判定部610は、入力画像から文字画像単位で切り出された部分画像(位置補正部540により補正がなされたもの)と、画像パターンとを重ねあわせて、一致判定部520(図5)と同様の手法により、一致度合いを算出し、算出された一致度合いが基準値以上であるか否かに基づいて、対応しているか否かを判定する。
パターン判定部610は、対応する画像パターンが発見された場合には、この部分画像の位置情報を位置情報符号化部620に対して出力し、この画像パターンのインデクスをインデクス符号化部630に対して出力する。また、パターン判定部610は、対応する画像パターンが発見されない場合には、この部分画像の画像データを画像符号化部640に対して出力する。
なお、本実施形態におけるパターン判定部610は、入力画像から切り出された文字画像と一致する画像パターンのインデクス、及び、文字画像の位置情報(位置補正部540により補正されたもの)を画像辞書作成部50から取得するため、文字画像として切り出された部分画像については、画像辞書作成部50から入力されたインデクス及び位置情報をそれぞれインデクス符号化部630及び位置情報符号化部620に出力し、文字画像として切り出されなかった部分画像(写真画像又は図形画像など)について、この部分画像の画像データを画像符号化部640に出力する。
インデクス符号化部630は、パターン判定部610から入力されたインデクスを符号化し、選択部660に対して出力する。例えば、インデクス符号化部630は、インデクスの出現頻度に応じて符号長が異なる符号をそれぞれのインデクスに付与する。
画像符号化部640は、画像(ラスタライズされた画像データ)に適した符号化方式を適用して、パターン判定部610から入力された部分画像を符号化し、選択部660に対して出力する。
辞書符号化部650(パターン符号化手段)は、画像辞書作成部50(図4,図5)から入力された画像辞書(画像パターンとインデクスとが互いに対応付けられたもの)を符号化し、符号出力部670に対して出力する。例えば、辞書符号化部650は、画像辞書902に含まれる画像パターン(ラスタデータ)を、画像に適した符号化方式により符号化する。なお、本例の画像辞書符号化部650は、テーブル生成部570により作成された文字対応テーブル904を、画像辞書の符号データに対応付けて符号出力部670に対して出力する。
符号出力部670は、選択部660から入力された符号データ(位置情報、インデクス及び部分画像の符号データ)と、辞書符号化部650から入力された符号データ(画像辞書の符号データ)と、文字対応テーブル904とを互いに対応付けてプリンタ装置10(図3)、記録装置24(図3)又は通信装置22(図3)に出力する。
次に、画像処理装置2による符号化処理の全体動作を説明する。
図7は、第1の実施形態における符号化プログラム5の動作(S10)を示すフローチャートである。なお、説明の便宜のために2値の画像データが入力される場合を具体例とする。
図7に示すように、ステップ100(S100)において、画像入力部40(図4)は、プリンタ装置10(図3)から画像データ(2値)が入力されると、入力された画像データ(入力画像)を画像辞書作成部50に対して出力する。また、画像入力部40の文字認識部410(図4)は、入力画像に対して文字認識処理を行い、入力画像に含まれる文字画像の文字コード及び位置情報を1文字ずつ判定し、判定された文字コード及び位置情報を画像辞書作成部50に対して出力する。
文字画像抽出部510(図5)は、入力された位置情報に基づいて、入力画像から文字画像を1文字分ずつ切り出して記憶部500に出力する。
ステップ104(S104)において、登録制御部560は、入力画像から順に切り出される文字画像の文字コードに基づいて、画像辞書902から画像パターン及びこの画像パターンのインデクスを読み出す。具体的には、記憶部500は、既に決定された画像パターン、この画像パターンに対して付与されたインデクス、及び、この画像パターンに対応する文字画像の文字コードを互いに対応付けて画像辞書として記憶している。登録制御部560は、文字画像抽出部510により新たに切り出された文字画像の文字コードを文字認識部410から取得し、取得された文字コードに対応する画像パターン及びインデクスを画像辞書から読み出す。
一致画素数Kは、画像における相対的な位置を示す位置ベクトルをx、画像パターンの黒画素の分布をS(x)、順に切り出される文字画像の番号をi(1〜N)、文字画像の黒画素の分布をP(i,x)、文字画像iのずらしベクトルをviとした場合に、以下の数式により算出される。
(一致画素数K)=Σ{S(x)*P(i,x−vi)}
なお、「Σ」は、変数xについての総和を示す。
次に、一致判定部520は、算出された一致画素数Kを正規化して、一致画素率K’を算出する。
一致画素率K’は、文字画像を構成する画素数をMとした場合に、以下の数式により算出される。
(一致画素率K’)=K/M
すなわち、登録制御部560は、一致度合いが基準以上である場合には、この文字画像に基づく画像パターンの登録を禁止して、この文字画像を既登録の画像パターンに基づいて符号化するよう符号化部60に指示し、一致度合いが基準よりも小さい場合には、この文字画像を画像パターンとして画像辞書に新規登録するよう辞書決定部530に指示する。
また、インデクス付与部550は、辞書決定部530により決定された画像パターンに対して、この画像パターンを一意に識別する識別情報(インデクス)を付与する。そして、インデクス付与部550は、付与したインデクスを画像パターンに対応付けて画像辞書として記憶部500に格納する。付与されるインデクスは、少なくとも、符号化対象として入力された全入力画像について、それぞれの画像パターンを一意に識別するものである。
また、画像辞書作成部50は、この文字画像に付与されたインデクス、及び、この文字画像の位置情報を符号化対象データとして符号化部60に対して順次出力する。
すなわち、画像辞書作成部50は、切り出された文字画像に対応する画像パターンが既に画像辞書902に登録されている場合に、登録されている画像パターンとこの文字画像とが最も一致するように切出し位置(文字画像の位置情報)を補正する。
なお、補正ベクトルにより補正された文字画像の位置情報は、この文字画像に対応する画像パターンのインデクスと共に、符号化対象データとして順次符号化部60に出力される。
なお、符号化プログラム5は、入力画像に含まれる文字画像以外の部分画像については、画像に適した符号化方式(MH、MMRなど)を適用して符号化する。
ステップ122(S122)において、符号化部60は、符号化された画像辞書と、画像辞書作成部50により作成された文字対応テーブル904とを、入力画像の符号データに対応付けてプリンタ装置10又は記録装置24等に出力する。
次に、上記のように符号化された画像データに対する画像操作を説明する。
図8は、制御装置20(図3)により実行され、本発明にかかる画像処理方法を実現する第1の画像操作プログラム7の機能構成を例示する図である。
図8に例示するように、画像操作プログラム7は、データ取得部700、記憶部710、文字検索部720、文字置換処理部730、復号化処理部740及び画像出力部750を有する。なお、文字検索部720及び文字置換処理部730はそれぞれ画像操作手段の一例である。
画像操作プログラム7において、データ取得部700は、利用者により操作対象となる画像データのデータファイルが指定されると、符号化プログラム5(図4)により符号化されたデータファイルの中から、指定されたデータファイルを取得し、取得されたデータファイルを記憶部710に対して出力する。このデータファイルには、符号化プログラム5により符号化された入力画像の画像データに加えて、上記画像辞書902及び文字対応テーブル904が含まれている。
記憶部710は、メモリ204(図3)及び記録装置24(図3)を制御して、データ取得部700により取得されたデータファイルを記憶する。
なお、文字検索処理部720は、文字列の検索が指示された場合に、文字列を構成する各文字の文字コードに対応するインデクスをそれぞれ特定し、特定されたインデクスに対応付けられた位置情報に基づいて、文字列の有無を判断してもよい。また、文字列に相当する画像パターンが画像辞書902に登録されてもよく、この場合に、テーブル生成部570は、文字列に含まれる文字コードとこの文字列に対応する画像パターンのインデクスとを互いに対応付けて文字対応テーブル904に登録し、文字検索処理部720は、この文字対応テーブル904を参照することにより、複数の文字からなる文字列の検索を行うことができる。
なお、置換後の文字画像が入力画像に含まれている場合には、文字置換処理部730は、文字対応テーブル904を参照して、置換後の文字の文字コードに対応するインデクスを特定し、特定されたインデクスに対応する画像パターンの符号データ(すなわち、置換後の文字の符号データ)を画像辞書902から抽出し、抽出された符号データを置換後の文字画像のデータとして利用してもよい。
次に、画像処理装置2による画像操作処理を説明する。
図9は、文字置換処理の概略を説明する図である。
図9に示すように、利用者から置換前の文字及び置換後の文字が指定されると、文字置換処理部730は、指定された置換前の文字に対応する文字コードを文字対応テーブル904内で検索し、置換前の文字に対応するインデクスを特定する。本例では、文字画像「B」を文字画像「A」に置換することが指示されているため、文字置換処理部730は、文字コード「0x42」(置換前の文字「B」に相当)を文字対応テーブル904で検索して、インデクス「#014」を特定する。
次に、文字置換処理部730は、画像辞書902において、特定されたインデクス「#014」に対応する画像パターン(文字画像「B」に相当)を、置換後の文字画像「A」のデータ(ファイル022)に置換する。本例では、文字画像「A」に相当する画像パターン「ファイル022」が画像辞書902に登録されているので、文字置換処理部730は、画像辞書902から置換後の文字画像のデータ「ファイル002」を読み出して置換処理に利用する。具体的には、文字置換処理部730は、文字対応テーブル904を参照して、置換後の文字の文字コード「0x41」に対応するインデクス「#022」(文字画像「A」に相当)を特定し、特定されたインデクス「#022」に対応する画像パターン(ファイル022)を画像辞書902から読み出す。
このように画像辞書902に登録された画像パターンが置換されると、この画像辞書902に基づいて再現される入力画像において、文字画像が置換されることになる。
図10に示すように、ステップ500(S500)において、利用者は、UI装置26(図3)を用いて、操作対象となる画像データのデータファイル(画像辞書及び文字対応テーブルが含まれたもの)を選択し、置換内容(置換前の文字及び置換後の文字)を指示する。
画像操作プログラム7におけるデータ取得部700(図8)は、利用者により選択されたデータファイルを記録装置24(図3)等から読み出して記憶部710に対して出力する。
記憶部710は、データ取得部700から入力されたデータファイル(入力画像の符号データ、画像辞書902のデータ、及び、文字対応テーブル904のデータ)をメモリ204(図3)に格納する。
文字置換処理部730は、メモリ204に記憶されたデータファイルの中から、文字対応テーブル904を取り出す。
ステップ504(S504)において、画像操作プログラム7は、置換前の文字の文字コードに対応するインデクスが発見された場合に、S506の処理に移行し、この文字コードに対応するインデクスが発見されなかった場合に、置換対象となる文字画像が入力画像に存在しない旨をUI装置26に表示して文字置換処理50を終了する。
画像操作プログラム7は、置換後の文字の文字コードに対応するインデクスが発見された場合に、S512の処理に移行し、置換後の文字の文字コードに対応するインデクスが発見されなかった場合に、S508の処理に移行する。すなわち、画像操作プログラム7は、置換後の文字に対応する画像パターンが画像辞書902に登録されている場合には、この画像パターンのデータを用いて置換処理を行い、置換後の文字に対応する画像パターンが画像辞書902に登録されていない場合には、置換後の文字画像のデータを作成する。
ステップ510(S510)において、文字置換処理部730は、作成された文字画像データ(置換後の文字画像)を、他の画像パターンと同一の符号化方式により符号化する。
次に、第2の実施形態を説明する。上記第1の実施形態における画像処理装置2は、画像辞書902に登録された画像パターンと文字コードとを互いに対応付けていたが、第2の実施形態における画像処理装置2は、画像辞書902に登録された画像パターンと、文字コード及びフォント情報の組合せとを互いに対応付ける。ここで、フォント情報とは、フォント画像に関する情報であり、例えば、フォントの種類、フォントサイズ、及び、フォントの色等である。
本実施形態における画像処理装置2は、文字コード及びフォント情報の組合せと、画像パターンとを互いに対応付けることにより、フォントの種類の変更、文字画像の拡大処理、文字画像の縮小処理、及び、文字画像の変形処理等を行うことができる。
図11に例示するように、第2の実施形態における画像処理装置2は、文字コード、フォント種類及びフォントサイズの組合せと、画像パターンに付与されたインデクスとを互いに対応付ける第2の文字対応テーブル906を作成する。文字対応テーブル906に登録されるフォント種類は、フォント画像の形状を規定する情報であり、例えば、ゴシック体、イタリック体又は明朝体などである。また、文字対応テーブル906に登録されるフォントサイズは、フォント画像の大きさを規定する情報である。
これにより、画像処理装置2は、文字コードだけでなく、フォント種類及びフォントサイズを指定して検索処理及び置換処理を行うことができる。また、画像処理装置2は、予め用意された種々のフォント画像を用いることにより、フォント種類の変更、フォントサイズの変更(文字画像の拡大又は縮小)、及び、文字画像の変形を行うことができる。
図12に示すように、第2の画像操作プログラム72は、第1の画像操作プログラム7(図8)の各構成に加えて、フォント提供部760、フォントデータベース(フォントDB)762、フォント変更部770、拡縮処理部780及び変形処理部790を有する。
フォント提供部760は、フォントDB762に記憶されたフォント画像を、フォント変更部770、拡縮処理部780又は変形処理部790等に提供する。具体的には、フォントDB762は、文字コード、フォント種類及びフォントサイズに対応付けて、この文字コードに対応するフォント画像(ラスタライズされた文字画像のデータ)を予め記憶している。フォント提供部760は、フォント変更部770、拡縮処理部780又は変形処理部790等からの要求に応じて、フォントDB762に記憶されているフォント画像の中から、要求されたフォント画像を選択し、選択したフォント画像を記憶部500に記憶する。
なお、変形処理部790は、フォントDB762から読み出されたフォント画像に対して画像変換処理を施し、特定された画像パターンをこの画像変換処理が施されたフォント画像のデータと置換することにより、画像パターンに対する画像変換処理を実現してもよい。
図13に示すように、S500において、利用者は、UI装置26(図3)を用いて、操作対象となる画像データのデータファイル(画像辞書及び文字対応テーブルが含まれたもの)を選択し、操作対象となる文字画像及び操作内容(拡縮処理又はフォント変更処理)を指示する。
画像操作プログラム72におけるデータ取得部700(図12)は、利用者により選択されたデータファイルを記録装置24(図3)等から読み出して記憶部710に対して出力して、入力画像の符号データ、画像辞書902のデータ及び文字対応テーブル906のデータをメモリ204(図3)に格納する。
S502において、画像操作プログラム72は、文字対応テーブル906を参照して、操作対象として指定された文字画像に対応するインデクスを文字コード及びフォント種類等に基づいて検索する。
画像操作プログラム72は、文字コード、フォント種類及びフォントサイズに対応するインデクスが文字対応テーブル906に存在する場合に、S524の処理に移行し、対応するインデクスが文字対応テーブル906に存在しない場合に、S528の処理に移行する。
なお、画像操作プログラム72(変形処理部790)は、フォントDB762から読み出されたフォント画像に対して、回転処理、アフィン変換処理又は射影変換処理を行って、フォント画像を所望の形状に変形させてもよい。
次に、上記実施形態の変形例を説明する。
上記実施形態では、画像辞書作成部50は、逐次的に入力画像から文字画像を切り出し、切り出された文字画像に基づいて順次画像辞書を作成していたが、これに限定されるものではなく、例えば、1ページ又は1ドキュメントなどの入力画像全体に基づいて、画像辞書を作成してもよい。また、画像辞書作成部50は、入力画像において形態が互いに類似する複数の文字画像を選択し、選択された複数の文字画像に基づいて画像辞書902に登録すべき画像パターンを作成してもよい。
そこで、第1の変形例における画像辞書作成装置50は、入力画像から切り出された文字画像を文字コード又は文字コードとフォント情報との組合せに基づいて分類し、分類された文字画像を出現頻度に応じて統合して、画像辞書に登録すべき画像パターンを作成する。なお、同一の文字コードで分類された文字画像から複数の画像パターンが作成されてもよい。
これにより、画像辞書作成部50は、文字画像の出現頻度などを加味して画像辞書902を作成することができるため、可読性に対する影響を抑えつつ高い圧縮率を実現できる。
図14に示すように、画像辞書作成部50は、文字コードに基づいて、入力画像に含まれる文字画像を複数の文字画像群に分類し、それぞれの文字画像群について黒画素の分布確率Q’(x)を算出する。算出された分布確率Q’(x)は、図14に例示するように、画素位置xによって異なる数値を示す。これは、分類された文字画像群の中に、形状の異なる文字画像が異なる出現頻度で混在しているからである。
分布確率Q’(x)は、以下の式により算出される。
Q(x)=P(1,x)+P(2,x−v2)+・・・+P(i−1,x−v(i−1))
Q’(x)=Q(x)/N
Q(x):分類された文字画像群の画素分布、P(i,x):各文字画像の黒画素分布、x:位置ベクトル、i:文字画像群に属する各文字画像(1〜N:Nは文字画像群に属する文字画像の数)
なお、i=1の場合には、Q(x)=P(1,x)となる。
なお、和結合パターンQ”(x)は、以下の条件式により算出される。
Q’(x)>閾値Bの場合に、Q”(x)=1
上記以外の場合に、Q”(x)=0
第2の変形例における画像辞書作成部50は、入力画像から切り出された文字画像を文字コード又は文字コードとフォント情報との組合せに基づいて分類し、分類された文字画像とそれらの出現頻度とに基づいて、分類された文字画像群における共通形状及び差分形状を抽出し、抽出された共通形状及び差分形状を階層化して画像辞書902に登録する。ここで、共通形状とは、文字コード等で分類された文字画像群に共通して存在する形状であり、差分形状とは、この文字画像群に属する各文字画像と共通形状との差分であって、出現頻度が基準値以上であるものをいう。
まず、画像辞書作成部50は、第1の変形例と同様に、文字コードに基づいて入力画像に含まれる文字画像を複数の文字画像群に分類し、それぞれの文字画像群について黒画素の分布確率Q’(x)を算出する。算出された分布確率Q’(x)は、図15に示すように、画素位置xによって異なる数値を示す。このうち、分布確率が最も高い部分は、この文字画像群に属する文字画像に共通する形状(すなわち、共通形状)であると考えられる。そして、分布確率が存在する他の領域は、それぞれの文字画像と共通形状との差分に相当する形状(すなわち、差分形状)であると考えられる。
まず、画像辞書作成部50は、分布確率Q’(x)に対して第1レベル閾値により閾値処理を行い、第1レベルパターン(共通形状)に相当する部分を抽出する。次に、分布確率Q’(x)から、抽出された第1レベルパターンに相当する部分が除去されて、第2レベル閾値を基準として「1」又は「0」に変換されることにより、第2レベル和結合パターンQ1”(x)が生成される。
画像辞書作成部50は、この第2レベル和結合パターンQ1”(x)と、各文字画像iの画素分布P(i,x)とを積演算することにより、これらの共通部分である第2レベルパターンを抽出する。本例では、第2レベル和結合パターンQ1”(x)と「文字画像#1」との共通部分は、第2レベルパターンaとなり、第2レベル和結合パターンQ1”(x)と「文字画像#2」との共通部分は、第2レベルパターンbとなる。
これにより、「文字画像#1」は、第1レベルパターンと第2レベルパターンaとの和としてそれぞれのインデクスに置換でき、「文字画像#2」は、第1レベルパターンと第2レベルパターンbとの和としてインデクスに置換できる。
第2の変形例では、1つの文字画像に対して、共通形状に相当する画像パターン(第1レベルパターン)と、差分形状に相当する画像パターン(第2レベルパターン)とが生成されており、それぞれの画像パターンにインデクスが付与されている。そこで、第2の変形例におけるテーブル生成部570(図5)は、図16に例示するように、1組の文字コード及びフォント情報に対して複数のインデクスが対応付けられた第3の文字対応テーブル908を作成する。
これにより、文字コードが同一であってもフォント種類の相違によって文字画像の形状が異なる場合(例えば、ゴシック体の「Q」と明朝体の「Q」)もあるが、これらの相違は差分形状に相当する画像パターン(第2レベルパターン)により再現可能となる。
5・・・符号化プログラム
40・・・画像入力部
410・・・文字認識部
420・・・PDLデコンポーザ
50・・・画像辞書作成部
510・・・文字画像抽出部
520・・・一致判定部
530・・・辞書決定部
540・・・位置補正部
550・・・インデクス付与部
560・・・登録制御部
570・・・テーブル生成部
60・・・符号化部
610・・・パターン判定部
620・・・位置情報符号化部
630・・・インデクス符号化部
640・・・画像符号化部
650・・・辞書符号化部
660・・・選択部
670・・・符号出力部
7・・・画像操作プログラム
700・・・データ取得部
710・・・記憶部
720・・・文字検索処理部
730・・・文字置換処理部
740・・・復号化処理部
750・・・画像出力部
760・・・フォント提供部
762・・・フォントデータベース
770・・・フォント変更部
780・・・拡縮処理部
790・・・変形処理部
Claims (11)
- 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定する類型決定手段と、
前記類型決定手段により決定された画像パターンに基づいて、入力画像の画像データを圧縮する圧縮手段と、
少なくとも、前記類型決定手段により決定された画像パターンと、文字識別情報とを互いに対応付ける対応付け手段と
を有する画像処理装置。 - 前記類型決定手段により決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与する識別情報付与手段
をさらに有し、
前記圧縮手段は、入力画像に含まれる文字画像を、対応する画像パターンに付与されたパターン識別情報と置換することにより、入力画像の画像データを圧縮し、
前記対応付け手段は、前記識別情報付与手段により付与されたパターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを生成することにより、画像パターンと文字識別情報とを互いに対応付ける
請求項1に記載の画像処理装置。 - 前記類型決定手段により決定された画像パターンの画像データを符号化するパターン符号化手段
をさらに有し、
少なくとも、前記対応付け手段により生成された文字対応テーブルと、前記パターン符号化手段により符号化された画像パターンとを出力する出力手段と
をさらに有する請求項2に記載の画像処理装置。 - 入力画像に含まれる文字画像それぞれが表す文字の文字識別情報を取得する情報取得手段
をさらに有し、
前記対応付け手段は、前記情報取得手段により取得された文字識別情報と、この文字識別情報に対応する文字画像に基づいて決定された画像パターンとを互いに対応付ける
請求項1に記載の画像処理装置。 - 前記情報取得手段は、入力画像に含まれる文字画像のフォント情報をさらに取得し、
前記対応付け手段は、前記情報取得手段により取得された文字識別情報及びフォント情報と、画像パターンとを互いに対応付ける
請求項4に記載の画像処理装置。 - 文字画像を構成する類型的な画像パターンとこの画像パターンそれぞれを識別するパターン識別情報とを互いに対応付ける画像辞書テーブル、この画像辞書テーブルに基づいて符号化された対象画像、及び、パターン識別情報と文字識別情報とを互いに対応付ける文字対応テーブルを取得するデータ取得手段と、
前記データ取得手段により取得された文字対応テーブルを用いて、対象画像に含まれる文字画像を操作する画像操作手段と
を有する画像処理装置。 - 前記画像操作手段は、前記文字対応テーブルにより互いに対応付けられた文字識別情報及びパターン識別情報に基づいて、対象画像に含まれる文字画像の検索処理又は置換処理を行う
請求項6に記載の画像処理装置。 - 前記文字対応テーブルは、さらに、画像パターンそれぞれに対応するフォント情報を前記パターン識別情報に対応付け、
前記データ取得手段は、前記画像辞書テーブル、符号化された対象画像、及び、パターン識別情報を文字識別情報とフォント情報とに対応付ける文字対応テーブルを取得し、
前記画像操作手段は、文字対応テーブルによりパターン識別情報と対応付けられたフォント情報に基づいて、対象画像に含まれる文字画像に対してフォントの変更処理又は拡縮処理を行う
請求項6に記載の画像処理装置。 - 対象画像に基づいて生成された画像パターンのデータと、
この画像パターンに基づいて圧縮された対象画像のデータと、
この画像パターンと文字識別情報とを互いに対応付ける文字対応テーブルと
を有するデータファイル。 - 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定し、
決定された画像パターンに対して、それぞれの画像パターンを識別するパターン識別情報を付与し、
決定された画像パターン及びこれらの画像パターンに付与されたパターン識別情報に基づいて、入力画像に含まれる文字画像をパターン識別情報に置換して、入力画像の画像データを圧縮し、
それぞれの画像パターンに付与されたパターン識別情報と文字識別情報とを互いに対応付け、
互いに対応付けられたパターン識別情報及び文字識別情報を用いて、圧縮された入力画像に対して文字画像の操作を行う
画像処理方法。 - 入力画像に含まれる文字画像に基づいて、文字画像を構成する類型的な画像パターンを決定するステップと、
決定された画像パターンに基づいて入力画像の画像データを圧縮するステップと、
少なくとも、決定された画像パターンと文字識別情報とを互いに対応付けて出力するステップと
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004139763A JP2005323169A (ja) | 2004-05-10 | 2004-05-10 | 画像処理装置、データファイル、画像処理方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004139763A JP2005323169A (ja) | 2004-05-10 | 2004-05-10 | 画像処理装置、データファイル、画像処理方法及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005323169A true JP2005323169A (ja) | 2005-11-17 |
Family
ID=35470103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004139763A Pending JP2005323169A (ja) | 2004-05-10 | 2004-05-10 | 画像処理装置、データファイル、画像処理方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005323169A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008219825A (ja) * | 2007-03-08 | 2008-09-18 | Fuji Xerox Co Ltd | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム |
JP2009099025A (ja) * | 2007-10-18 | 2009-05-07 | Nec Corp | パスワード発行方法と携帯端末とパスワード認証方法 |
JP2009213145A (ja) * | 2007-02-21 | 2009-09-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2020013217A (ja) * | 2018-07-13 | 2020-01-23 | 株式会社リコー | 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム |
-
2004
- 2004-05-10 JP JP2004139763A patent/JP2005323169A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009213145A (ja) * | 2007-02-21 | 2009-09-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP4553055B2 (ja) * | 2007-02-21 | 2010-09-29 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US8411955B2 (en) | 2007-02-21 | 2013-04-02 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
JP2008219825A (ja) * | 2007-03-08 | 2008-09-18 | Fuji Xerox Co Ltd | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム |
JP2009099025A (ja) * | 2007-10-18 | 2009-05-07 | Nec Corp | パスワード発行方法と携帯端末とパスワード認証方法 |
JP2020013217A (ja) * | 2018-07-13 | 2020-01-23 | 株式会社リコー | 情報処理システム、画像ログ検索方法、情報処理装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7889926B2 (en) | Image dictionary creating apparatus, coding apparatus, image dictionary creating method | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
US7391917B2 (en) | Image processing method | |
US7349577B2 (en) | Image processing method and image processing system | |
JP3796500B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4393161B2 (ja) | 画像処理装置及び画像処理方法 | |
US20010016067A1 (en) | Apparatus and methodology for submitting search oueries | |
JP4510535B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP3997198B2 (ja) | 画像処理システム及び画像処理方法 | |
JP3862694B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2008109394A (ja) | 画像処理装置及びその方法、プログラム | |
US20050226516A1 (en) | Image dictionary creating apparatus and method | |
JP2006023940A (ja) | 画像処理システム及び画像処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
US20060182358A1 (en) | Coding apparatus, decoding apparatus, data file, coding method, decoding method, and programs thereof | |
JP2005323169A (ja) | 画像処理装置、データファイル、画像処理方法及びそのプログラム | |
JP2005352735A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
CN100501728C (zh) | 图像处理方法、系统、程序、程序存储介质以及信息处理设备 | |
JP4645058B2 (ja) | 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム | |
JP2005149210A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2005352734A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
JP2005352736A (ja) | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム | |
JP2005174227A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4753007B2 (ja) | 画像符号化装置、画像復号化装置及びこれらのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070419 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090501 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090616 |