JP2014232930A

JP2014232930A - 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム

Info

Publication number: JP2014232930A
Application number: JP2013111927A
Authority: JP
Inventors: 堤　隆弘; Takahiro Tsutsumi; 隆弘堤
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2013-05-28
Filing date: 2013-05-28
Publication date: 2014-12-11
Anticipated expiration: 2033-05-28
Also published as: JP6119427B2

Abstract

【課題】他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置を提供する。
【解決手段】画像処理装置は、処理対象の画像の画像データ５０に基づいて、文字属性を有する文字形状部分を複数のグループ６１〜７５に分離し、分離されたグループ６１〜７５毎に、他のグループと異なるコード情報を付与する。各グループ６１〜７５の文字形状部分に関する情報は、そのグループ６１〜７５に付与されたコード情報と関連付けてフォント情報として登録される。画像データ５０とフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルが生成される。ファイルには、各グループ６１〜７５の画像データ５０内における位置を示す位置情報及びそのグループ６１〜７５のコード情報が埋め込まれる。
【選択図】図４

Description

この発明は、画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムに関し、特に、画像を文字属性を有する領域とその他の領域とに区別して処理することができる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムに関する。

画像形成装置（スキャナ機能、ファクシミリ機能、複写機能、プリンタとしての機能、データ通信機能、及びサーバ機能を備えたＭＦＰ（ＭｕｌｔｉＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）、ファクシミリ装置、複写機、プリンタなど）やスキャナ装置などの画像処理装置としては、画像処理により、入力画像のうち、文字として判別される領域とその他の領域などとを区別するものがある。

下記特許文献１には、画像処理装置において、入力画像データと予め登録された登録画像との類似度を判定し、判定結果に応じた制御を行うことが記載されている。この画像処理装置は、類似度の最大値が閾値以上である場合、類似度が最大値である登録画像が画像処理の実行を許可する登録画像であるか、あるいは画像処理の実行を禁止または制限する例外登録画像であるかを判断し、この判断結果に応じて入力画像データに対する画像処理の実行の禁止または制限の要否を決定する。

特開２００８−２６９５８２号公報

上記のような画像処理装置には、例えばスキャン機能を持つ装置（ＭＦＰなど）でスキャンされた画像について画像処理する場合に、その画像を画像データと文字属性データとを組み合わせたものして保存するものがある。文字属性データを利用すると、出力時に様々な処理を行うことができる。

具体的には、文字部と背景部とで異なる階調再現手段を用いて画像を表すことで解像力を向上させたり、文字エッジ部を強調して文字の可読性を向上させたりすることが可能となる。例えば、スクリーン領域について、文字部のスクリーンマトリクスサイズを背景部より小さくして階調性よりも解像力を優先して示すことができる。

また、例えば、いわゆるコンパクトＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）などを生成することができる。すなわち、文字部を解像力を保持したまま２値化し、その他領域を低解像度のＪＰＥＧ形式の画像とすることで、文字の可読性を保持したままでファイルサイズを大幅に低減することができる。例えば、ファイルサイズを処理前の１／１０程度に低減することが可能である。

図１２は、従来の画像処理装置における画像の処理例を示す図である。

図１２に示されるように、画像は、画像データ８５０と文字属性データ８５５との組み合わせとして保存される。図１２においては、画像データ８５０と文字属性データ８５５とが図示されている。画像データ８５０は、例えば、「ＷｏｒｄＡｒｔ」と表示されている文字列８５６と、「警察消防」と表示されている文字列８５８とを含んでいる。文字列８５６は、例えば黒色であり、文字列８５８は、例えば赤色である（図１２においては斜線で示す）。各文字列８５６，８５８は、通常の表記態様と比較して、両端部に近づくにつれて上下方向の高さが大きくなるように、全体として湾曲するように変形されて表示されている。

文字属性データ８５５は、画像データ８５０に基づいて生成されるものであり、画像中の文字に相当する部分を、文字属性を有する部分として特定するデータである。

ところで、このように画像データと文字属性データとの組み合わせとして保存された画像を、当該画像処理装置とは異なる機器等で利用しようとすると、問題が生じる可能性があった。

すなわち、このような画像に含まれる文字属性データは、スキャンを行った装置独自の形式に基づくもの（独自仕様のもの）である場合が多い。この場合、独自仕様の文字属性データを有する画像を、他種のＭＦＰなどでプリントアウトしたり、ＢＯＸ（記憶領域）へ出力したりすることができない可能性がある。結果として、独自仕様の文字属性データは、他の互換性がない装置においては、意味のないデータとなってしまう可能性がある。

このような問題を避けるには、独自仕様の文字属性データを含む画像を、文字属性データを含まない画像に変換して送信せざるを得ない。しかしながら、このように変換する場合には、プリント画像の画質が劣化したり、ＢＯＸに出力したデータにおいて文字属性データに依存する機能（例えば、いわゆるコンパクトＰＤＦの生成機能など）が使用できなくなったりするという問題がある。

すなわち、画像データのみを用いてプリントすることになるため、文字属性データを用いてプリントを行う場合と比較して、文字部を強調することができず、文字がぼけたり解像力が不足したりする可能性がある。

また、ファイルサイズを小さくするためには、画像データの解像度を下げたり、色情報を破棄したり（カラー→モノクロ）する必要があるところ、文字部分とそうでない部分との区別を行うことができない。そのため、画像の情報を画像の全体で一様に欠落させなければならず、文字の可読性が犠牲になる可能性がある。

ここで、このような問題に関して、画像データまたは文字属性データについて、ＯＣＲ（光学式文字認識）処理を利用して文字を文字コードに置き換える方法が考えられる。しかしながら、このような方法では、ＯＣＲ処理が正常に行われたとしても、ＯＣＲ処理によりオリジナルの文字形状が変形する可能性がある。ここで、文字形状の変形とは、次の２つのような状態を含む。

すなわち、第１に、文字の意味が正しくなるようにＯＣＲ認識が行われた場合であっても、原稿において使用されているフォントを完全に検出することはできない。そのため、文字コードに置き換えた文字について、フォントが一致せず、文字形状の変化が生じる可能性がある。特に、いわゆるワードアートのようにユーザが文字として認識できる形状であっても、対応するフォントが存在しないものがあり、そのような文字については、ＯＣＲにより文字形状が変化してしまうことが避けられない。ＯＣＲ処理が正しく行われても、文字部分の見た目やレイアウトが変化してしまい、元の画像通りの出力結果を得ることができなくなる場合がある。

第２に、ＯＣＲ処理において誤判別が発生する可能性がある。誤判別が発生すると、文字が、その文字とは異なる文字に置き換えられてしまう。この場合には、字形の変形のみならず、その文字を用いた単語の意味が破壊され、意味情報が失われる可能性がある。特に、スキャン画像には画像のゆらぎが発生している可能性があり、誤判別が発生しやすく、文字の細かい特徴まで完全に元の画像に一致させることは困難である。

図１３は、従来のＯＣＲ処理を行った場合の画像の例を示す図である。

図１３には、上述の図１２に示される画像８５０についてＯＣＲ処理を行って、その結果を用いて構築された、元の画像８５０に対応する画像８５０ａが示されている。図１３に示されるように、処理後の画像８５０ａには、文字列８５６についてＯＣＲ処理を行って再配置された文字列８５６ａと、文字列８５８についてＯＣＲ処理を行って再配置された文字列８５８ａとが含まれている。

ここで、文字列８５６ａと文字列８５８ａとは、共に、上述の文字列８５６，８５８のように湾曲したものではなく、通常の態様で配置された文字で構成されている。例えば、楕円Ｐ１で囲んだ文字列８５６ａに着目すると、「ＷｏｒｄＡｒｔ」の各文字が互いに同一のポイント数で水平に並んで配置されている。すなわち、画像８５０ａにおいては、ＯＣＲ処理を行った結果として文字形状に変化が生じており、元の画像データ８５０とは異なる態様のものとなっている。

また、文字列８５８ａについては、ＯＣＲ処理において文字の誤判別が発生している（楕円Ｐ２で囲んだ部分）。すなわち、文字列８５８ａにおいては、本来「察」という文字と「消」という文字であるべき部分が、「ｊ＾ｐｃ肖」と誤って判別されている。このように本来の文字が異なる文字に置き換えられていることにより、元々の文字列８５８の意味が破壊され、文字列８５８ａが意味不明なものとなっている。

この発明はそのような問題点を解決するためになされたものであり、他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムを提供することを目的としている。

上記目的を達成するためこの発明のある局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置は、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離手段と、分離手段により分離されたグループ毎に、他のグループと異なるコード情報を付与する付与手段と、付与手段により付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録手段と、画像データとフォント登録手段により登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成手段とを備え、生成手段は、生成するファイルに、分離手段により分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。

好ましくは、付与手段は、コード情報として、所定値以下のコード長を有するものを付与する。

好ましくは、分離手段は、画像データに基づいて、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように、分離を行う。

好ましくは、分離手段は、画像データ及び文字属性データに基づいて、所定の判断条件に基づいて文字色が同一であると判定された文字形状部分を複数のグループに分離する。

好ましくは、分離手段は、重複しないコードを処理対象の画像について生成できる数に応じてグループ数の制限を行う。

好ましくは、分離手段は、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行う。

好ましくは、分離手段は、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行う。

好ましくは、分離手段は、処理対象の画像を複数のページに分割することで、分割後のページの画像についてのグループ数の制限を行う。

好ましくは、生成手段は、生成するファイルに、コード情報とともに、コード情報に対応する文字の色彩に関する情報を埋め込む。

好ましくは、生成手段は、生成するファイルに、コード情報とともに、コード情報に関する文字の形状に関する情報を埋め込む。

好ましくは、画像処理装置は、画像データについてＯＣＲ（光学式文字認識）処理を行うＯＣＲ処理手段と、ＯＣＲ処理手段によるＯＣＲ処理結果の信頼度を取得する信頼度取得手段とをさらに備え、生成手段は、信頼度取得手段により取得された信頼度に応じて、ファイルの生成を行う。

この発明の他の局面に従うと、画像読取装置は、上述のいずれかに記載の画像処理装置と、原稿を読み取って画像を生成する読取手段とを備え、画像処理装置は、読取手段により生成された画像を処理対象として、その画像に対応するファイルを生成する。

この発明のさらに他の局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置の制御方法は、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、画像データとフォント登録ステップにより登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとを備え、生成ステップは、生成するファイルに、分離ステップにより分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。

この発明のさらに他の局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置の制御プログラムは、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、画像データとフォント登録ステップにより登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとをコンピュータに実行させ、生成ステップは、生成するファイルに、分離ステップにより分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。

これらの発明に従うと、コード情報とそのコード情報に対応するグループの文字形状部分に関する情報とがフォント情報として登録されると共に、生成するファイルに、各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報が埋め込まれる。したがって、他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムを提供することができる。

本発明の実施の形態の１つにおける画像形成装置を示す正面図である。画像形成装置の制御回路の構成を示すブロック図である。画像データ及び文字属性データの一例を示す。グループ化処理の一例を示す図である。コード情報の付与について説明する図である。１つの画像に関して生成されるファイルに埋め込まれる情報の例を示す図である。文字画像の消去例を示す図である。ファイル生成処理を説明するフローチャートである。フォント登録処理を説明する第１のフローチャートである。フォント登録処理を説明する第２のフローチャートである。第２の実施の形態における画像形成装置のファイル生成処理を示すフローチャートである。従来の画像処理装置における画像の処理例を示す図である。従来のＯＣＲ処理を行った場合の画像の例を示す図である。

以下、本発明の実施の形態における画像形成装置（画像処理装置の一例）について説明する。

［概要］

画像形成装置は、スキャナ機能、複写機能、プリンタとしての機能、ファクシミリ機能、データ通信機能、及びサーバ機能を備えたＭＦＰ（ＭｕｌｔｉＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）である。スキャナ機能では、セットされた原稿の画像を読み取ってそれをＨＤＤ等に蓄積する。複写機能では、さらにそれを用紙等に印刷（プリント）する。プリンタとしての機能では、ＰＣ（パーソナルコンピュータ）等の外部端末から印刷指示を受けるとその指示に基づいて用紙に印刷を行う。ファクシミリ機能では、外部のファクシミリ装置等からファクシミリデータを受信してそれをＨＤＤ等に蓄積する。データ通信機能では、接続された外部機器との間でデータを送受信する。サーバ機能では、複数のユーザでＨＤＤ等に記憶したデータなどを共有可能にする。

画像形成装置は、例えばスキャナ機能で読み取った画像や、印刷する対象となる画像などについて、画像処理を行う。画像形成装置は、画像処理により、読み取った画像に対応する文字属性データと画像データとを得る。さらに、画像形成装置は、画像処理により、文字属性データと画像データと両データに基づいて、読み取った画像を他の装置等で構築できるように、ファイルを生成する。生成するファイルは、文字部分については文字属性を有するものであって、他の装置等においてその部分が文字であると認識可能なものとなる。

具体的には、画像形成装置は、画像処理を次のようにして行う。すなわち、文字属性データを得ると、文字属性データを任意のサイズでグループ化する。そして、各グループに、処理単位（ジョブ単位）で重複しないような文字コードを付与する。各グループの文字形状は、ビットマップ形式や、アウトライン処理などを施した状態の形式で、フォントとして登録される。読み取った画像（ドキュメントなど）からは、各文字に対応する画像を削除しつつ、その文字を文字コードとして画像に埋め込む。なお、文字色は、グループ毎に特定しておき、文字色データとして画像に埋め込むようにすればよい。このように画像の文字部分をフォントとして登録する方法を採ることにより、文字属性を保持しつつ、従来のファイルと同じ構成でファイル生成を可能にすることができ、文字属性領域を文字として出力することができる。

［実施の形態］

図１は、本発明の実施の形態の１つにおける画像形成装置を示す正面図である。

［画像形成装置の構成］

図１を参照して、画像形成装置１は、画像形成部３、画像読取部５、画像処理部２１、給紙部３０、及び排紙部３１などを備える。

図２は、画像形成装置１の制御回路の構成を示すブロック図である。

図２を参照して、画像形成装置１は、画像形成装置１のシステム全体を制御するＣＰＵ（中央演算処理装置）１１を中心に、各モジュールが制御通信及び制御信号に基づいて制御される構成を有している。画像形成装置１は、上述の各部のほか、表示部７、パネル操作部９、記憶部１３、ＲＯＭ１５、ＲＡＭ１７、不揮発メモリ１９、画像出力部２３、ファクシミリ制御部２５、及びネットワーク接続部２７などを備えている。

ＣＰＵ１１は、判別部１１ａと、削除部１１ｂと、ＣＰＵ１１ｃと、通報部１１ｄとを有している。ＣＰＵ１１は、判別部１１ａ、削除部１１ｂ、ＣＰＵ１１ｃ、及び通報部１１ｄなどにより、画像形成装置１の各部と通信もしくは信号の送受信を行ったり、種々の判断や情報の削除などを実行することで、画像形成装置１のシステム全体を制御する。

画像形成部３は、例えば、トナー像形成部（図示せず）と、用紙搬送部（図示せず）と、定着装置（図示せず）とを有し、電子写真方式により用紙に画像を形成する。用紙は、給紙部３０から用紙搬送部によってトナー像形成部に搬送される。また、トナー像形成部及び定着装置で画像が形成された用紙は、用紙搬送部により、排紙部３１に排紙される。画像形成部３は、画像処理部２１により画像処理が行われた画像に基づいて、用紙に画像形成を行う。画像形成部３は、いわゆるタンデム方式で４色の画像を合成し、用紙にカラー画像を形成可能に構成されている。

画像読取部５は、画像形成装置１の筐体の上部に配置されている。画像読取部５は、ＡＤＦ（ＡｕｔｏＤｏｃｕｍｅｎｔＦｅｅｄｅｒ）５ａを有している。画像読取部５は、上述のスキャナ機能を実行する。画像読取部５は、透明な原稿台に配置された原稿をコンタクトイメージセンサにより走査して、それを画像データとして読み取る。また、画像読取部５は、原稿トレイにセットされた複数枚の原稿を、ＡＤＦ５ａにより順次取り込みながら、コンタクトイメージセンサによりその画像データを読み取る。画像読取部５により読み取られた画像データは、ＣＰＵ１１によりアプリケーションデータ形式に変換され、記憶部１３などに記憶される。

表示部７は、例えば、画像を表示するＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）である。表示部７には、例えば、画像形成装置１の状態を示す画像や操作の案内画像など、ＣＰＵ１１の制御の下、種々の画像が表示される。なお、表示部７は、パネル操作部９を兼ねたものであってもよい。

パネル操作部９は、例えば、タッチパネルを備えたＬＣＤである。パネル操作部９は、ユーザに案内画面を表示したり、操作ボタンを表示してユーザからのタッチ操作を受け付けたりする。パネル操作部９は、ＣＰＵ１１により制御されて表示を行う。パネル操作部９は、ユーザにより操作入力されると、その操作に応じた操作信号又は所定のコマンドをＣＰＵ１１に送信する。すなわち、ユーザは、パネル操作部９に操作を行うことにより、画像形成装置１に種々の動作を実行させることができる。

記憶部１３は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）である。記憶部１３は、ネットワーク接続部２７を介して外部から送られたジョブ（ＪＯＢ）のデータや、画像読取部５で読み取った画像データなどを記憶する。また、記憶部１３は、画像形成装置１の設定情報や、画像形成装置１の種々の動作を行うための制御プログラム１３ａなどを記憶する。記憶部１３は、１つのクライアントＰＣ又は複数のクライアントＰＣなどから送信された複数のジョブを記憶可能である。なお、記憶部１３は、ＲＯＭ１５や不揮発メモリ１９などを兼ねていてもよい。

ＲＯＭ１５は、例えばフラッシュＲＯＭ（ＦｌａｓｈＭｅｍｏｒｙ）である。ＲＯＭ１５には、画像形成装置１の動作を行うために用いられるデータが記憶されている。ＲＯＭ１５には、記憶部１３と同様に、種々の制御プログラムや、画像形成装置１の機能設定データなどが記憶されていてもよい。ＣＰＵ１１は、所定の処理を行うことにより、ＲＯＭ１５からのデータの読み込みや、ＲＯＭ１５へのデータの書き込みを行う。なお、ＲＯＭ１５は、書換え不可能なものであってもよい。

ＲＡＭ１７は、ＣＰＵ１１のメインメモリである。ＲＡＭ１７は、後述のようにＣＰＵ１１が制御プログラム１３ａを実行するときに必要なデータを記憶するのに用いられる。

不揮発メモリ１９は、例えばフラッシュＲＯＭ（ＦｌａｓｈＭｅｍｏｒｙ）である。不揮発メモリ１９には、ＲＯＭ１５や記憶部１３と同様に、種々の制御プログラムや、画像形成装置１の機能設定データなどが記憶されていてもよい。ＣＰＵ１１は、画像形成装置１の制御を行うのに必要なときなどに、不揮発メモリ１９からのデータの読み込みや、不揮発メモリ１９へのデータの書き込みを行う。

画像処理部２１は、ＣＰＵ１１による制御の下、種々の画像処理を行う機能を有している。画像処理としては、例えば、印刷対象の画像データをＣＭＹＫ方式のデータに変換する処理や、画像データの特性に応じた画像データの補正処理などがある。

また、画像処理としては、画像読取部５に読み取られた画像データに基づいて、画像データと文字属性データとを組み合わせたファイルを生成するファイル生成処理がある。ファイル生成処理については、後述する。

画像出力部２３は、例えば、記憶部１３などに記憶された画像データを、ネットワーク接続部２７などを介して、外部のＰＣなどに送信可能である。画像出力部２３は、例えば、電子メールやＦＴＰ（ＦｉｌｅＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）など、種々の通信プロトコルにより、画像を出力可能である。なお、画像出力部２３は、後述のような画像処理を施した画像を送信することができる。

ファクシミリ制御部２５は、上述のファクシミリ機能を制御し、外部の機器とファクシミリ通信を行う。ファクシミリ制御部２５は、受信部２５ａを備えている。画像形成装置１は、後述のような画像処理を施した画像をファクシミリ送信することができる。

ネットワーク接続部２７は、例えば、ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ）などのハードウェア部と、所定の通信プロトコルで通信を行うソフトウェア部とが組み合わされて構成されている。ネットワーク接続部２７は、画像形成装置１をＬＡＮなどの外部ネットワークに接続する。これにより、画像形成装置１は、外部ネットワークに接続されているクライアントＰＣなどの外部装置と通信可能になる。画像形成装置１は、ＰＣなどが接続された外部ネットワークに接続されている場合、そのＰＣなどから印刷ジョブを受信可能である。また、画像形成装置１は、上述の画像出力部２３などにより、画像読取部５で読み取った画像データを、ＰＣに送信したり、メールサーバなどを介してＥ−ｍａｉｌにより送信したりすることができる。なお、ネットワーク接続部２７は、無線通信により外部ネットワークに接続可能に構成されていてもよい。

ＣＰＵ１１は、ＲＯＭ１５、ＲＡＭ１７、又は記憶部１３などに記憶された制御プログラム１３ａなどを実行することにより、画像形成装置１の種々の動作を制御する。ＣＰＵ１１は、パネル操作部９から操作信号が送られたり、ネットワーク接続部２７を介して通信可能なＰＣなどから操作コマンドが送信されたりすると、それらに応じて所定の制御プログラム１３ａを実行する。これにより、ユーザによるパネル操作部９の操作などに応じて、画像形成装置１の所定の機能が実行される。

［ファイル生成処理の説明］

本実施の形態において、画像読取部５で処理対象となる画像が読み込まれたときには、次のようにして、処理対象となる画像に対応するファイルを生成するファイル生成処理が行われる。なお、ここで「処理対象となる画像」とは、１つの画像でもよいし、複数の画像（例えば、複数ページの画像など）であってもよい。ファイル生成処理は、ＣＰＵ１１が、制御プログラム１３ａに基づいて画像処理部２１を制御することで行われる。ファイル生成処理は、おおまかに、領域判別処理、グループ化処理、フォント情報の登録処理、情報埋め込み処理の各処理を含む。

［領域判別処理］

まず、領域判別処理により、処理対象となる画像の画像データに基づいて、文字属性データが生成される。このような処理は、従来より一般的に行われているものである。領域判別処理により、画像データ（ＢｉｔＭａｐなどのＲＧＢ形式に基づくデータ）と、画像形成装置１の独自仕様の文字属性データが保持される。文字属性データは、画像データのうち、文字である領域を示すデータであって、処理対象のうち文字属性を有する文字形状部分を示すデータである。これらのデータは、例えば、記憶部１３に記憶される。

図３は、画像データ及び文字属性データの一例を示す。

図３においては、画像データ５０を示すイメージと文字属性データ５５を示すイメージとが示されている。画像データ５０は、例えば、「ＷｏｒｄＡｒｔ」なる文字列５６と、「警察消防」なる文字列５８とを含んでいる。画像データ５０は、背景５１を背景に、上段に文字列５６が配置され、下段に文字列５８が配置されて構成されている。文字列５６と文字列５８とは、それぞれ、両端部に近づくほど文字の上下の寸法が大きくなるように、全体として湾曲するように変形された文字で構成されている。文字列５６の色は例えば黒色であり、文字列５８の色は例えば赤色である（図３においては斜線で示す）。

文字属性データ５５は、画像データ５０について領域判別処理を行うことで生成された、画像データ５０に対応するデータである。文字属性データ５５は、画像データ５０中の文字属性を有する文字形状部分を示すデータである。図３においては、文字形状部分の輪郭が示されている。すなわち、文字属性データ５５は、文字列５６の輪郭形状と、文字列５８の輪郭形状との情報を含むものである。

文字形状取得は、アウトラインフォントであれば文字のアウトライン形状を取得するが、形状のベクター化は公知であるためここでは詳細に記載しない。

［グループ化処理］

このように領域判別処理が行われると、文字形状部分を複数のグループに分離する分離処理（グループ化処理）が行われる。グループ化処理は、画像データ５０及び文字属性データ５５に基づいて行われる。グループ化処理は、以下の第１の条件及び第２の条件を満たすように行われる。

第１の条件は、グループのデータサイズを、画像形成装置１におけるフォント登録に関する仕様に適合し、かつ、文字形状に関する情報が欠損しないような大きさとすることである。一般的なアウトラインフォントを例に取ると、フォントのデータサイズは、アウトラインデータを構成するベジェ曲線の制御点の数に応じた大きさになる。また、文字の画素毎のオン、オフを示すデータで構成されるビットマップフォントでは、画素の数に応じた大きさのデータサイズになる。１つのグループの画像が大きくなると、そのグループの文字形状を正確に保持するためのデータサイズも大きくなり、画像形成装置１で取り扱うことができなくなる。グループのデータサイズを抑えるには、アウトラインフォントであれば制御点を減らして文字形状を単純化することが必要であり、ビットマップフォントであれば文字形状の微細な変化は丸め込んで低解像度化して画素を減らすことが必要である。しかしながら、この場合には、文字形状に関する情報の一部が欠落することになる。

第２の条件は、同じ文字色同士の文字形状部分をグループ化することである。

このような２つの条件を満たすようにするため、本実施の形態では、文字属性の連続領域をまず抽出し、その連続領域同士がある程度距離的に近接し、かつ文字色が同じ場合に１つのグループとなるように、グループ化処理が行われる。具体的には、グループ化処理は、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように行われる。このとき、文字色が同一であると判定された文字形状部分同士が、複数のグループに分離される。文字色が同一かどうかは、例えば、文字属性を有する部分の色空間距離が所定値未満であるか否かなど、所定の判断条件に基づいて判別される。文字色は、文字属性の連続領域が抽出されて文字属性データ５５が生成され、対応する画像データ５０を参照することで、容易に求めることができる。

図４は、グループ化処理の一例を示す図である。

図４においては、図３に示した画像データ５０についてグループ化処理が行われた場合におけるグループの分離態様の一例が示されている。図４に示されるように、文字列５６は、６つのグループ６１〜６６に分離される。すなわち、「ＷｏｒｄＡｒｔ」は、「Ｗ」（グループ６１）、「ｏ」（グループ６２）、「ｒ」（グループ６３）、「ｄ」（グループ６４）、「Ａ」（グループ６５）、「ｒｔ」（グループ６６）に分離される。また、文字列５８は、５つのグループ７１〜７５に分離される。すなわち、「警察消防」は、「警」（グループ７１）、「察」（グループ７２）、「消」のへん（グループ７３）、「肖（「消」のつくり）」（グループ７４）、「防」（グループ７５）に分離される。

このような例で示されるように、グループ化は、画像に含まれる文字の形状を保持するために行われる。すなわち、グループ化は、必ずしも各文字の意味が保持されるように行われなくてもよく、１文字単位のグループに分離されることは必要ではない。例えば、上述の例では、文字列５６のうち「ｒｔ」は結合しているため、１つのグループ６６として扱われる。また、文字列５８のうち「消」はへんとつくりとが比較的離れているため、２つのグループ７３，７４に分離されて取り扱われる。

［フォント情報の登録］

グループ化処理が行われると、ＣＰＵ１１は、グループ毎に、他のグループと異なるコード情報（文字コード）を付与する。そして、グループの文字形状部分の形状情報と、そのグループに付与されたコード情報とを互いに関連付けて、フォント情報として登録する。コード情報としては、所定値以下のコード長を有するものが付与される。

図５は、コード情報の付与について説明する図である。

図５においては、上述のように分離されたグループ６１〜６６，７１〜７５についてのコード情報の付与例が示されている。図５に示されるように、コード情報は、その画像において一意に各グループを特定できるもの（他のグループに付与されるコード情報と重複しないもの）が付与される。例えば、グループ６１〜６６のそれぞれには、順に、「０ｘ００００」〜「０ｘ０００５」がコード情報として付与される。また、グループ７１〜７５のそれぞれには、順に、「０ｘ０００６」〜「０ｘ０００９」、「０ｘ０００Ａ」がコード情報として付与される。

このようにコード情報が付与されると、コード情報と、そのコード情報が付与されたグループに含まれる形状情報とが関連付けられる。これにより、コード情報に対応して、文字の形状を特定できるようになる。このとき登録した形状情報は、その画像についての独自のフォントとして取り扱うことができる。登録した形状情報とコード情報との組み合わせの１色には、独自のフォント名が付与される。

［情報の埋め込み］

フォント情報の登録が完了すると、ＣＰＵ１１は、画像データ５０に基づいて、ファイルを生成する。ファイルには、例えば、画像データ５０と、各グループの画像データ５０内における位置を示す位置情報と、そのグループのコード情報とが埋め込まれる。また、本実施の形態においては、コード情報に対応する文字の色彩に関する情報や、登録されたフォント情報が、ファイルに埋め込まれる。なお、文字の色彩情報やフォント情報は、必ずしも位置情報が埋め込まれるファイルに埋め込まれなくてもよく、別のファイルとして生成されるようにしてもよい。

生成されるファイルにコード情報を埋め込む場合には、例えば次のようにすればよい。すなわち、ファイルの文字表示エリアを定義し、登録した独自のフォント名と、コード情報と、文字色と、位置とを文字（グループ）毎に指定する。指定は、例えば次に示すようにＸＭＬ形式などで記載することができるが、これに限られるものではない。なお、各文字（グループ）のサイズについても指定するようにしてもよい。

＜ｆｏｎｔｎａｍｅ＝”○○○○”／＞（独自のフォント名を記載）

＜ｃｏｌｏｒｔｈｅｍｅ＝”１”／＞（文字色をテーマ別に記載、なお具体的に所定の表色系で色を指定してもよい。）

＜ｃｏｏｄｉｎａｔｅ．ｘｘｘ＝ＸＸＸＸＸ＞（位置（座標）を記載）

＜”ＹＹＹＹＹＹＹ”＞（コード情報を記載）

図６は、１つの画像に関して生成されるファイルに埋め込まれる情報の例を示す図である。

図６に示されるように、ファイルには、例えば、コード情報（文字コード）、位置、色、サイズに関する情報が、各文字（コード情報単位）で埋め込まれる。すなわち、上述の画像データ５０については、コード情報が「０ｘ００００」〜「０ｘ０００９」，「０ｘ０００Ａ」のそれぞれについて、このような情報が埋め込まれる。

以上のように生成されたファイルは、処理対象の画像に対応する画像を生成（構築）するための情報を含んでいる。すなわち、ファイルに含まれるコード情報及びそれと共に指定された情報に基づいて文字形状を画像データ５０に合成することにより、元の処理対象の画像に対応する画像を構築することができる。

なお、ファイルを生成するとき、画像データ５０に対応する文字コード等の情報を埋め込んでもよいし、画像データ５０から文字形状部分の画像（文字画像）を消去した画像に文字コード等の情報を埋め込んでもよい。

図７は、文字画像の消去例を示す図である。

図７には、画像データ５０について文字画像を消去した状態の画像が示されている。図７中の破線で囲んだ領域は、グループ６１〜６６，７１〜７５の位置を示している。文字画像の消去は、例えば、文字形状部分をその近傍の背景５１ａの色で塗りつぶすことにより行うことができる。なお、各グループ６１〜６６，７１〜７５の領域全体を、背景５１ａの色で塗りつぶすようにしてもよい。

画像データ５０にフォント登録した文字を合成するとき、元々画像データ５０にある文字画像と、合成する文字形状部分との微妙な位置ずれが発生すると、文字が太る可能性がある。しかしながら、このように文字画像を予め消去しておくことで、合成時に若干の位置ずれが発生しても、文字が太ることを防止できる。

上述のようなファイル生成処理の流れについて、フローチャートを参照しながら改めて説明する。

図８は、ファイル生成処理を説明するフローチャートである。

図８に示されるように、ファイル生成処理は、画像４１（画像データ）と文字属性４２（文字属性データ５５）とのそれぞれについて進み、最終的に両データについての処理結果をまとめたファイルが生成される。一連の処理は、ＣＰＵ１１の制御に基づいて行われる。

ステップＳ１０１において、文字属性４２について連続領域が検出される。

ステップＳ１０３において、連続領域が検出された文字属性４２と、画像４１とに基づいて、フォント登録処理が行われる。フォント登録処理は、後述のようにして行われる。

フォント登録処理が行われると、その結果に応じて、ステップＳ１０５の処理が行われる。ステップＳ１０５において、画像４１について文字画像が消去される。

ステップＳ１０７において、文字画像が消去された画像４１と、フォント登録処理の結果とに基づいて、ファイル生成が行われる。ファイルが生成されると、処理が終了する。

図９は、フォント登録処理を説明する第１のフローチャートである。

図９に示されるように、フォント登録処理がスタートすると、ステップＳ１２１において、文字領域の文字色が判定される。

ステップＳ１２２において、文字色が同一色である領域が検出される。

ステップＳ１２３において、文字領域の領域間の距離が規定値以下であるか否かが判別される。

ステップＳ１２３において規定値以下であれば、ステップＳ１２４において、領域間距離が規定値以下となる領域同士をひとまとまりに結合する。

ステップＳ１２３において規定値以下でないとき、及びステップＳ１２４の処理が終了したとき、ステップＳ１２５において、グループ化を行う。文字領域が、各領域のまとまり毎に、グループとして分離される。

ステップＳ１２６において、グループの数がカウントされる。

ステップＳ１２７において、グループの数が規定位置以下であるか否かを判別する。規定値以下であれば次の処理に進む。他方、グループの数が規定位置以下でなければ、ステップＳ１２８の処理に進む。

ステップＳ１２８において、領域間距離の閾値が若干拡大される。領域間距離が大きく設定される。領域間距離の閾値が変更されると、ステップＳ１２２からステップＳ１２７までの処理が繰り返される。

図１０は、フォント登録処理を説明する第２のフローチャートである。

図１０に示されるように、ステップＳ１２９において、各グループについてコード情報が付与される。コード情報が付与されると、グループに関する情報を利用して、画像４１について文字画像の消去が行われる。

ステップＳ１３０において、各グループに含まれる文字形状が取得される。文字形状は、文字属性データを利用して取得される。

ステップＳ１３１において、取得された文字形状とコード情報とを用いて、フォント登録が行われる。

ステップＳ１３２において、各グループの画像４１中での座標（位置情報）が取得される。取得された位置情報は、コード情報に基づいて、生成されるファイルに埋め込まれる。

グループの位置情報が取得されると、フォント登録処理が終了する。

以上説明したように、本実施の形態では、ＣＰＵ１１が、文字属性データを複数のグループに分解し、グループ毎に重複しないコード情報を割り当てる。そして、各グループについて、文字形状を抽出し、コード情報と対応付けてフォントとして登録する。この方法により生成されるファイルは、通常の文字コードを埋め込んだファイルと同じ構成を有するものとなる。したがって、生成されたファイルは、元々の画像における文字属性の情報を欠落させることなく、生成した他のアプリケーションや、プリンタドライバなどでの処理が可能なものとなる。プリンタドライバ等で他の画像形成装置（ＭＦＰ）のＢＯＸ領域（記憶領域）に出力する（記憶させる）場合を考えると、埋め込まれたコード情報は、上記のように登録されたフォントの形状データに変換され、所定の形式のプリント用のファイル（ＰＲＮ形式ファイルなど）に埋め込まれる。画像形成装置は、プリント用のファイルからラスタライズしたデータを生成する。このとき、文字にはテキスト（ＴＥＸＴ）属性が割り当てられる（プリント時の通常動作）。このようにテキスト属性の割り当てが行われることで、どの画素が文字領域であるかを正確に判断することができる。それにより、画質や機能性を損なうことなく、データを利用できる。

ここで、画像形成装置１の環境によっては、付与できるコード情報の数に制限がある。例えば、２ｂｙｔｅ文字を扱える環境であれば、１つのフォントが利用できる文字コードの数は、６５５３６種類以下である。グループの数がこの数を超えると、各グループへの重複しないコード割り当てができなくなる。このような問題に対し、本実施の形態では、重複しないコードを処理対象の画像について生成できる数に応じて、グループ数の制限が行われる。グループ数の制限は、例えば、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで行われる。すなわち、上述の図９のステップＳ１２８における処理のように、領域間距離が変更されて大きくなると、若干離れている領域同士が結合されて１つのグループにまとめられるので、グループの数が低減する。したがって、確実に、処理対象の画像に対応する画像を構築できるファイルを生成できる。

なお、ファイルは処理対象の画像について生成されるところ、フォント登録も、その処理対象の画像において、複数のグループ一式について行われる。例えば、あるドキュメントの第１ページと第２ページとについて印刷指示を行う場合において、その２ページ分の画像が処理対象となる。このとき、処理対象となる画像について、重複しないコード割り当てができるかどうかに応じて、グループ数の制限が行われるようにすればよい。

また、グループ数の制限は、次のようにして行われてもよい。例えば、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行うようにしてもよい。この場合、グループ化時に多少異なる文字色同士であっても同一のグループに含まれる。また、例えば、処理対象の画像を複数のページに分割することで、分割後のページの画像についてのグループ数が少なくなるようにしてもよい。この場合、分割したページ毎に、ファイルの生成を行うようにすればよい。

また、グループ数が多いときには、フォント情報を登録するときに、複数のフォントセットとして（複数のフォント名（「カスタムフォントＡ」、「カスタムフォントＢ」、…など）で）登録を行うようにしてもよい。この場合、フォント名とコード情報とで登録された文字形状を特定できるので、処理対象の画像に対応する画像を構築できる。

［第２の実施の形態］

第２の実施の形態における画像形成装置の基本的な構成は、第１の実施の形態におけるそれと同じであるためここでの説明を繰り返さない。第２の実施の形態においては、ファイル生成時にＯＣＲ処理を併せて行う点が、第１の実施の形態と異なる。

ＯＣＲ処理によって文字形状が変化してしまう場合でも、文字の意味が保持されている場合には、さほど大きな問題にならない場面もある。一方、文字の誤判別が発生すると、文字の意味が破壊されてしまい、問題が大きくなる。一般的に、誤判別が生じるときには、ＯＣＲの信頼度が低くなる。第２の実施の形態では、ＯＣＲ処理結果の信頼度を取得し、信頼度に応じて、ファイルの生成処理が行われる。なお、ＯＣＲの信頼度とは、ＯＣＲ処理における辞書データとの一致率を示す指標であり、一般的に利用されているＯＣＲエンジン毎に定義されている指標をいう。

より具体的には、ＣＰＵ１１は、ＯＣＲ処理の結果、信頼度が高い場合には、そのままＯＣＲ処理の結果を利用して、文字コードを埋め込むことでファイルを生成する。他方、信頼度が低い場合には、画像データ中の文字を文字コードに変換せず、上述の第１の実施の形態と同様に、フォント登録処理等を行って、独自のコード情報を埋め込んでファイルを生成する。このような動作は、ＯＣＲを行う文字単位で行われる。

図１１は、第２の実施の形態における画像形成装置１のファイル生成処理を示すフローチャートである。

図１１に示されるように、ステップＳ２０１において、ＯＣＲ処理を文字単位で行う。

ステップＳ２０３において、ＯＣＲ処理の信頼度を取得する。

ステップＳ２０５において、信頼度が規定値以上であるか否かを判断する。

ステップＳ２０５において規定値以上であれば、ステップＳ２０７において、ＯＣＲ処理の結果を利用して、その文字について文字コードの埋め込みを行う。

他方、ステップＳ２０５において規定値以上でなければ、ステップＳ２０９，Ｓ２１１，Ｓ２１３の処理が行われる。これらの処理は、上述の第１の実施の形態と同様にして、その文字について行われる。

ある文字について以上の処理が行われると、他の文字についても同様の処理が行われる。

各文字についての処理が完了すると、ステップＳ２１５において、ファイルの生成処理が行われる。ここで生成されるファイルについては、ＯＣＲ処理の信頼度が高い文字についてＯＣＲ処理の結果を利用した文字コードが埋め込まれ、信頼度が低い文字については、第１の実施の形態と同様にフォント登録が行われた文字形状に対応するコード情報が埋め込まれたものとなる。

このように、第２の実施の形態においては、ＯＣＲ処理を高い信頼度で行えるときにはＯＣＲ処理の結果を利用しつつ、ＯＣＲ処理を適切に行うことが困難であるときにはフォント登録を行うことで、効率的にファイル生成を行うことができる。これにより、手書き文字や、ワードアートなどの任意形状の文字について、誤判別により意味が失われてしまうことを効率的に回避することができるようになる。

［その他］

なお、画像形成装置のハードウェア構成は上述に限られるものではなく、画像処理が種々の制御回路により行われるようにしてもよい。

このようなファイル生成処理は、画像形成装置の画像読取部で読み取られた画像を処理する場合に限られない。例えば、他の装置から送信された画像を画像形成装置で処理する場合にも、このようなファイル生成処理を適用可能である。

上述の実施の形態では、フォント登録を行い、生成するファイルには文字コードを埋め込むものであったが、ファイル自体に文字形状を埋め込むようにしてもよい（例えば、ＰＤＦ／Ａ形式など）。

画像形成装置としては、モノクロ／カラーの複写機、プリンタ、ファクシミリ装置やこれらの複合機（ＭＦＰ）などいずれであってもよい。電子写真方式により画像を形成するものに限られず、例えばいわゆるインクジェット方式により画像を形成するものであってもよい。

また、本発明に係る画像処理装置は、画像形成装置に用いられるものに限られない。例えば、本発明は、画像データを読み取るスキャナ装置や、撮像装置や、画像データ送受信装置など、種々の装置に用いられる画像処理装置においても適用可能である。

上述の実施の形態における処理は、ソフトウェアによって行っても、ハードウェア回路を用いて行ってもよい。

上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをＣＤ−ＲＯＭ、フレキシブルディスク、ハードディスク、ＲＯＭ、ＲＡＭ、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。上記のフローチャートで文章で説明された処理は、そのプログラムに従ってＣＰＵなどにより実行される。

上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

１画像形成装置（画像処理装置の一例、画像読取装置の一例）
３画像形成部
５画像読取部
１１ＣＰＵ
１３記憶部
１３ａ制御プログラム
２１画像処理部

Claims

処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置であって、
前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離手段と、
前記分離手段により分離されたグループ毎に、他のグループと異なるコード情報を付与する付与手段と、
前記付与手段により付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録手段と、
前記画像データと前記フォント登録手段により登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成手段とを備え、
前記生成手段は、生成するファイルに、前記分離手段により分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置。
前記付与手段は、前記コード情報として、所定値以下のコード長を有するものを付与する、請求項１に記載の画像処理装置。
前記分離手段は、前記画像データに基づいて、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように、前記分離を行う、請求項１又は２に記載の画像処理装置。
前記分離手段は、前記画像データ及び前記文字属性データに基づいて、所定の判断条件に基づいて文字色が同一であると判定された文字形状部分を複数のグループに分離する、請求項１から３のいずれかに記載の画像処理装置。
前記分離手段は、重複しないコードを処理対象の画像について生成できる数に応じてグループ数の制限を行う、請求項１から４のいずれかに記載の画像処理装置。
前記分離手段は、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで、前記グループ数の制限を行う、請求項５に記載の画像処理装置。
前記分離手段は、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、前記グループ数の制限を行う、請求項５又は６に記載の画像処理装置。
前記分離手段は、処理対象の画像を複数のページに分割することで、分割後のページの画像についての前記グループ数の制限を行う、請求項５から７のいずれかに記載の画像処理装置。
前記生成手段は、生成するファイルに、前記コード情報とともに、前記コード情報に対応する文字の色彩に関する情報を埋め込む、請求項１から８のいずれかに記載の画像処理装置。
前記生成手段は、生成するファイルに、前記コード情報とともに、前記コード情報に関する文字の形状に関する情報を埋め込む、請求項１から９のいずれかに記載の画像処理装置。
前記画像データについてＯＣＲ（光学式文字読取）処理を行うＯＣＲ処理手段と、
前記ＯＣＲ処理手段によるＯＣＲ処理結果の信頼度を取得する信頼度取得手段とをさらに備え、
前記生成手段は、前記信頼度取得手段により取得された信頼度に応じて、前記ファイルの生成を行う、請求項１から１０のいずれかに記載の画像処理装置。
請求項１から１１のいずれかに記載の画像処理装置と、
原稿を読み取って画像を生成する読取手段とを備え、
前記画像処理装置は、前記読取手段により生成された画像を処理対象として、その画像に対応するファイルを生成する、画像読取装置。
処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置の制御方法であって、
前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、
前記分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、
前記付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、
前記画像データと前記フォント登録ステップにより登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとを備え、
前記生成ステップは、生成するファイルに、前記分離ステップにより分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置の制御方法。
処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置の制御プログラムであって、
前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、
前記分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、
前記付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、
前記画像データと前記フォント登録ステップにより登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとをコンピュータに実行させ、
前記生成ステップは、生成するファイルに、前記分離ステップにより分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置の制御プログラム。