JP2014232930A - 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム - Google Patents

画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム Download PDF

Info

Publication number
JP2014232930A
JP2014232930A JP2013111927A JP2013111927A JP2014232930A JP 2014232930 A JP2014232930 A JP 2014232930A JP 2013111927 A JP2013111927 A JP 2013111927A JP 2013111927 A JP2013111927 A JP 2013111927A JP 2014232930 A JP2014232930 A JP 2014232930A
Authority
JP
Japan
Prior art keywords
image
character
information
processing apparatus
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013111927A
Other languages
English (en)
Other versions
JP6119427B2 (ja
Inventor
堤 隆弘
Takahiro Tsutsumi
隆弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2013111927A priority Critical patent/JP6119427B2/ja
Publication of JP2014232930A publication Critical patent/JP2014232930A/ja
Application granted granted Critical
Publication of JP6119427B2 publication Critical patent/JP6119427B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置を提供する。
【解決手段】画像処理装置は、処理対象の画像の画像データ50に基づいて、文字属性を有する文字形状部分を複数のグループ61〜75に分離し、分離されたグループ61〜75毎に、他のグループと異なるコード情報を付与する。各グループ61〜75の文字形状部分に関する情報は、そのグループ61〜75に付与されたコード情報と関連付けてフォント情報として登録される。画像データ50とフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルが生成される。ファイルには、各グループ61〜75の画像データ50内における位置を示す位置情報及びそのグループ61〜75のコード情報が埋め込まれる。
【選択図】図4

Description

この発明は、画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムに関し、特に、画像を文字属性を有する領域とその他の領域とに区別して処理することができる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムに関する。
画像形成装置(スキャナ機能、ファクシミリ機能、複写機能、プリンタとしての機能、データ通信機能、及びサーバ機能を備えたMFP(Multi Function Peripheral)、ファクシミリ装置、複写機、プリンタなど)やスキャナ装置などの画像処理装置としては、画像処理により、入力画像のうち、文字として判別される領域とその他の領域などとを区別するものがある。
下記特許文献1には、画像処理装置において、入力画像データと予め登録された登録画像との類似度を判定し、判定結果に応じた制御を行うことが記載されている。この画像処理装置は、類似度の最大値が閾値以上である場合、類似度が最大値である登録画像が画像処理の実行を許可する登録画像であるか、あるいは画像処理の実行を禁止または制限する例外登録画像であるかを判断し、この判断結果に応じて入力画像データに対する画像処理の実行の禁止または制限の要否を決定する。
特開2008−269582号公報
上記のような画像処理装置には、例えばスキャン機能を持つ装置(MFPなど)でスキャンされた画像について画像処理する場合に、その画像を画像データと文字属性データとを組み合わせたものして保存するものがある。文字属性データを利用すると、出力時に様々な処理を行うことができる。
具体的には、文字部と背景部とで異なる階調再現手段を用いて画像を表すことで解像力を向上させたり、文字エッジ部を強調して文字の可読性を向上させたりすることが可能となる。例えば、スクリーン領域について、文字部のスクリーンマトリクスサイズを背景部より小さくして階調性よりも解像力を優先して示すことができる。
また、例えば、いわゆるコンパクトPDF(Portable Document Format)などを生成することができる。すなわち、文字部を解像力を保持したまま2値化し、その他領域を低解像度のJPEG形式の画像とすることで、文字の可読性を保持したままでファイルサイズを大幅に低減することができる。例えば、ファイルサイズを処理前の1/10程度に低減することが可能である。
図12は、従来の画像処理装置における画像の処理例を示す図である。
図12に示されるように、画像は、画像データ850と文字属性データ855との組み合わせとして保存される。図12においては、画像データ850と文字属性データ855とが図示されている。画像データ850は、例えば、「WordArt」と表示されている文字列856と、「警察消防」と表示されている文字列858とを含んでいる。文字列856は、例えば黒色であり、文字列858は、例えば赤色である(図12においては斜線で示す)。各文字列856,858は、通常の表記態様と比較して、両端部に近づくにつれて上下方向の高さが大きくなるように、全体として湾曲するように変形されて表示されている。
文字属性データ855は、画像データ850に基づいて生成されるものであり、画像中の文字に相当する部分を、文字属性を有する部分として特定するデータである。
ところで、このように画像データと文字属性データとの組み合わせとして保存された画像を、当該画像処理装置とは異なる機器等で利用しようとすると、問題が生じる可能性があった。
すなわち、このような画像に含まれる文字属性データは、スキャンを行った装置独自の形式に基づくもの(独自仕様のもの)である場合が多い。この場合、独自仕様の文字属性データを有する画像を、他種のMFPなどでプリントアウトしたり、BOX(記憶領域)へ出力したりすることができない可能性がある。結果として、独自仕様の文字属性データは、他の互換性がない装置においては、意味のないデータとなってしまう可能性がある。
このような問題を避けるには、独自仕様の文字属性データを含む画像を、文字属性データを含まない画像に変換して送信せざるを得ない。しかしながら、このように変換する場合には、プリント画像の画質が劣化したり、BOXに出力したデータにおいて文字属性データに依存する機能(例えば、いわゆるコンパクトPDFの生成機能など)が使用できなくなったりするという問題がある。
すなわち、画像データのみを用いてプリントすることになるため、文字属性データを用いてプリントを行う場合と比較して、文字部を強調することができず、文字がぼけたり解像力が不足したりする可能性がある。
また、ファイルサイズを小さくするためには、画像データの解像度を下げたり、色情報を破棄したり(カラー→モノクロ)する必要があるところ、文字部分とそうでない部分との区別を行うことができない。そのため、画像の情報を画像の全体で一様に欠落させなければならず、文字の可読性が犠牲になる可能性がある。
ここで、このような問題に関して、画像データまたは文字属性データについて、OCR(光学式文字認識)処理を利用して文字を文字コードに置き換える方法が考えられる。しかしながら、このような方法では、OCR処理が正常に行われたとしても、OCR処理によりオリジナルの文字形状が変形する可能性がある。ここで、文字形状の変形とは、次の2つのような状態を含む。
すなわち、第1に、文字の意味が正しくなるようにOCR認識が行われた場合であっても、原稿において使用されているフォントを完全に検出することはできない。そのため、文字コードに置き換えた文字について、フォントが一致せず、文字形状の変化が生じる可能性がある。特に、いわゆるワードアートのようにユーザが文字として認識できる形状であっても、対応するフォントが存在しないものがあり、そのような文字については、OCRにより文字形状が変化してしまうことが避けられない。OCR処理が正しく行われても、文字部分の見た目やレイアウトが変化してしまい、元の画像通りの出力結果を得ることができなくなる場合がある。
第2に、OCR処理において誤判別が発生する可能性がある。誤判別が発生すると、文字が、その文字とは異なる文字に置き換えられてしまう。この場合には、字形の変形のみならず、その文字を用いた単語の意味が破壊され、意味情報が失われる可能性がある。特に、スキャン画像には画像のゆらぎが発生している可能性があり、誤判別が発生しやすく、文字の細かい特徴まで完全に元の画像に一致させることは困難である。
図13は、従来のOCR処理を行った場合の画像の例を示す図である。
図13には、上述の図12に示される画像850についてOCR処理を行って、その結果を用いて構築された、元の画像850に対応する画像850aが示されている。図13に示されるように、処理後の画像850aには、文字列856についてOCR処理を行って再配置された文字列856aと、文字列858についてOCR処理を行って再配置された文字列858aとが含まれている。
ここで、文字列856aと文字列858aとは、共に、上述の文字列856,858のように湾曲したものではなく、通常の態様で配置された文字で構成されている。例えば、楕円P1で囲んだ文字列856aに着目すると、「WordArt」の各文字が互いに同一のポイント数で水平に並んで配置されている。すなわち、画像850aにおいては、OCR処理を行った結果として文字形状に変化が生じており、元の画像データ850とは異なる態様のものとなっている。
また、文字列858aについては、OCR処理において文字の誤判別が発生している(楕円P2で囲んだ部分)。すなわち、文字列858aにおいては、本来「察」という文字と「消」という文字であるべき部分が、「j^pc肖」と誤って判別されている。このように本来の文字が異なる文字に置き換えられていることにより、元々の文字列858の意味が破壊され、文字列858aが意味不明なものとなっている。
この発明はそのような問題点を解決するためになされたものであり、他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムを提供することを目的としている。
上記目的を達成するためこの発明のある局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置は、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離手段と、分離手段により分離されたグループ毎に、他のグループと異なるコード情報を付与する付与手段と、付与手段により付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録手段と、画像データとフォント登録手段により登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成手段とを備え、生成手段は、生成するファイルに、分離手段により分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。
好ましくは、付与手段は、コード情報として、所定値以下のコード長を有するものを付与する。
好ましくは、分離手段は、画像データに基づいて、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように、分離を行う。
好ましくは、分離手段は、画像データ及び文字属性データに基づいて、所定の判断条件に基づいて文字色が同一であると判定された文字形状部分を複数のグループに分離する。
好ましくは、分離手段は、重複しないコードを処理対象の画像について生成できる数に応じてグループ数の制限を行う。
好ましくは、分離手段は、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行う。
好ましくは、分離手段は、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行う。
好ましくは、分離手段は、処理対象の画像を複数のページに分割することで、分割後のページの画像についてのグループ数の制限を行う。
好ましくは、生成手段は、生成するファイルに、コード情報とともに、コード情報に対応する文字の色彩に関する情報を埋め込む。
好ましくは、生成手段は、生成するファイルに、コード情報とともに、コード情報に関する文字の形状に関する情報を埋め込む。
好ましくは、画像処理装置は、画像データについてOCR(光学式文字認識)処理を行うOCR処理手段と、OCR処理手段によるOCR処理結果の信頼度を取得する信頼度取得手段とをさらに備え、生成手段は、信頼度取得手段により取得された信頼度に応じて、ファイルの生成を行う。
この発明の他の局面に従うと、画像読取装置は、上述のいずれかに記載の画像処理装置と、原稿を読み取って画像を生成する読取手段とを備え、画像処理装置は、読取手段により生成された画像を処理対象として、その画像に対応するファイルを生成する。
この発明のさらに他の局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置の制御方法は、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、画像データとフォント登録ステップにより登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとを備え、生成ステップは、生成するファイルに、分離ステップにより分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。
この発明のさらに他の局面に従うと、処理対象の画像に対応する画像データと画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、記憶部に記憶されたデータを用いて処理対象の画像に対応するファイルを生成する画像処理装置の制御プログラムは、文字属性データに基づいて、文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、画像データとフォント登録ステップにより登録されたフォント情報とに基づいて、処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとをコンピュータに実行させ、生成ステップは、生成するファイルに、分離ステップにより分離された各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む。
これらの発明に従うと、コード情報とそのコード情報に対応するグループの文字形状部分に関する情報とがフォント情報として登録されると共に、生成するファイルに、各グループの画像データ内における位置を示す位置情報及びそのグループのコード情報が埋め込まれる。したがって、他の装置においても利用可能となるように、画像中の文字属性に関する情報を生成できる画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラムを提供することができる。
本発明の実施の形態の1つにおける画像形成装置を示す正面図である。 画像形成装置の制御回路の構成を示すブロック図である。 画像データ及び文字属性データの一例を示す。 グループ化処理の一例を示す図である。 コード情報の付与について説明する図である。 1つの画像に関して生成されるファイルに埋め込まれる情報の例を示す図である。 文字画像の消去例を示す図である。 ファイル生成処理を説明するフローチャートである。 フォント登録処理を説明する第1のフローチャートである。 フォント登録処理を説明する第2のフローチャートである。 第2の実施の形態における画像形成装置のファイル生成処理を示すフローチャートである。 従来の画像処理装置における画像の処理例を示す図である。 従来のOCR処理を行った場合の画像の例を示す図である。
以下、本発明の実施の形態における画像形成装置(画像処理装置の一例)について説明する。
[概要]
画像形成装置は、スキャナ機能、複写機能、プリンタとしての機能、ファクシミリ機能、データ通信機能、及びサーバ機能を備えたMFP(Multi Function Peripheral)である。スキャナ機能では、セットされた原稿の画像を読み取ってそれをHDD等に蓄積する。複写機能では、さらにそれを用紙等に印刷(プリント)する。プリンタとしての機能では、PC(パーソナルコンピュータ)等の外部端末から印刷指示を受けるとその指示に基づいて用紙に印刷を行う。ファクシミリ機能では、外部のファクシミリ装置等からファクシミリデータを受信してそれをHDD等に蓄積する。データ通信機能では、接続された外部機器との間でデータを送受信する。サーバ機能では、複数のユーザでHDD等に記憶したデータなどを共有可能にする。
画像形成装置は、例えばスキャナ機能で読み取った画像や、印刷する対象となる画像などについて、画像処理を行う。画像形成装置は、画像処理により、読み取った画像に対応する文字属性データと画像データとを得る。さらに、画像形成装置は、画像処理により、文字属性データと画像データと両データに基づいて、読み取った画像を他の装置等で構築できるように、ファイルを生成する。生成するファイルは、文字部分については文字属性を有するものであって、他の装置等においてその部分が文字であると認識可能なものとなる。
具体的には、画像形成装置は、画像処理を次のようにして行う。すなわち、文字属性データを得ると、文字属性データを任意のサイズでグループ化する。そして、各グループに、処理単位(ジョブ単位)で重複しないような文字コードを付与する。各グループの文字形状は、ビットマップ形式や、アウトライン処理などを施した状態の形式で、フォントとして登録される。読み取った画像(ドキュメントなど)からは、各文字に対応する画像を削除しつつ、その文字を文字コードとして画像に埋め込む。なお、文字色は、グループ毎に特定しておき、文字色データとして画像に埋め込むようにすればよい。このように画像の文字部分をフォントとして登録する方法を採ることにより、文字属性を保持しつつ、従来のファイルと同じ構成でファイル生成を可能にすることができ、文字属性領域を文字として出力することができる。
[実施の形態]
図1は、本発明の実施の形態の1つにおける画像形成装置を示す正面図である。
[画像形成装置の構成]
図1を参照して、画像形成装置1は、画像形成部3、画像読取部5、画像処理部21、給紙部30、及び排紙部31などを備える。
図2は、画像形成装置1の制御回路の構成を示すブロック図である。
図2を参照して、画像形成装置1は、画像形成装置1のシステム全体を制御するCPU(中央演算処理装置)11を中心に、各モジュールが制御通信及び制御信号に基づいて制御される構成を有している。画像形成装置1は、上述の各部のほか、表示部7、パネル操作部9、記憶部13、ROM15、RAM17、不揮発メモリ19、画像出力部23、ファクシミリ制御部25、及びネットワーク接続部27などを備えている。
CPU11は、判別部11aと、削除部11bと、CPU11cと、通報部11dとを有している。CPU11は、判別部11a、削除部11b、CPU11c、及び通報部11dなどにより、画像形成装置1の各部と通信もしくは信号の送受信を行ったり、種々の判断や情報の削除などを実行することで、画像形成装置1のシステム全体を制御する。
画像形成部3は、例えば、トナー像形成部(図示せず)と、用紙搬送部(図示せず)と、定着装置(図示せず)とを有し、電子写真方式により用紙に画像を形成する。用紙は、給紙部30から用紙搬送部によってトナー像形成部に搬送される。また、トナー像形成部及び定着装置で画像が形成された用紙は、用紙搬送部により、排紙部31に排紙される。画像形成部3は、画像処理部21により画像処理が行われた画像に基づいて、用紙に画像形成を行う。画像形成部3は、いわゆるタンデム方式で4色の画像を合成し、用紙にカラー画像を形成可能に構成されている。
画像読取部5は、画像形成装置1の筐体の上部に配置されている。画像読取部5は、ADF(Auto Document Feeder)5aを有している。画像読取部5は、上述のスキャナ機能を実行する。画像読取部5は、透明な原稿台に配置された原稿をコンタクトイメージセンサにより走査して、それを画像データとして読み取る。また、画像読取部5は、原稿トレイにセットされた複数枚の原稿を、ADF5aにより順次取り込みながら、コンタクトイメージセンサによりその画像データを読み取る。画像読取部5により読み取られた画像データは、CPU11によりアプリケーションデータ形式に変換され、記憶部13などに記憶される。
表示部7は、例えば、画像を表示するLCD(Liquid Crystal Display)である。表示部7には、例えば、画像形成装置1の状態を示す画像や操作の案内画像など、CPU11の制御の下、種々の画像が表示される。なお、表示部7は、パネル操作部9を兼ねたものであってもよい。
パネル操作部9は、例えば、タッチパネルを備えたLCDである。パネル操作部9は、ユーザに案内画面を表示したり、操作ボタンを表示してユーザからのタッチ操作を受け付けたりする。パネル操作部9は、CPU11により制御されて表示を行う。パネル操作部9は、ユーザにより操作入力されると、その操作に応じた操作信号又は所定のコマンドをCPU11に送信する。すなわち、ユーザは、パネル操作部9に操作を行うことにより、画像形成装置1に種々の動作を実行させることができる。
記憶部13は、例えば、HDD(Hard Disk Drive)である。記憶部13は、ネットワーク接続部27を介して外部から送られたジョブ(JOB)のデータや、画像読取部5で読み取った画像データなどを記憶する。また、記憶部13は、画像形成装置1の設定情報や、画像形成装置1の種々の動作を行うための制御プログラム13aなどを記憶する。記憶部13は、1つのクライアントPC又は複数のクライアントPCなどから送信された複数のジョブを記憶可能である。なお、記憶部13は、ROM15や不揮発メモリ19などを兼ねていてもよい。
ROM15は、例えばフラッシュROM(Flash Memory)である。ROM15には、画像形成装置1の動作を行うために用いられるデータが記憶されている。ROM15には、記憶部13と同様に、種々の制御プログラムや、画像形成装置1の機能設定データなどが記憶されていてもよい。CPU11は、所定の処理を行うことにより、ROM15からのデータの読み込みや、ROM15へのデータの書き込みを行う。なお、ROM15は、書換え不可能なものであってもよい。
RAM17は、CPU11のメインメモリである。RAM17は、後述のようにCPU11が制御プログラム13aを実行するときに必要なデータを記憶するのに用いられる。
不揮発メモリ19は、例えばフラッシュROM(Flash Memory)である。不揮発メモリ19には、ROM15や記憶部13と同様に、種々の制御プログラムや、画像形成装置1の機能設定データなどが記憶されていてもよい。CPU11は、画像形成装置1の制御を行うのに必要なときなどに、不揮発メモリ19からのデータの読み込みや、不揮発メモリ19へのデータの書き込みを行う。
画像処理部21は、CPU11による制御の下、種々の画像処理を行う機能を有している。画像処理としては、例えば、印刷対象の画像データをCMYK方式のデータに変換する処理や、画像データの特性に応じた画像データの補正処理などがある。
また、画像処理としては、画像読取部5に読み取られた画像データに基づいて、画像データと文字属性データとを組み合わせたファイルを生成するファイル生成処理がある。ファイル生成処理については、後述する。
画像出力部23は、例えば、記憶部13などに記憶された画像データを、ネットワーク接続部27などを介して、外部のPCなどに送信可能である。画像出力部23は、例えば、電子メールやFTP(File Transfer Protocol)など、種々の通信プロトコルにより、画像を出力可能である。なお、画像出力部23は、後述のような画像処理を施した画像を送信することができる。
ファクシミリ制御部25は、上述のファクシミリ機能を制御し、外部の機器とファクシミリ通信を行う。ファクシミリ制御部25は、受信部25aを備えている。画像形成装置1は、後述のような画像処理を施した画像をファクシミリ送信することができる。
ネットワーク接続部27は、例えば、NIC(Network Interface Card)などのハードウェア部と、所定の通信プロトコルで通信を行うソフトウェア部とが組み合わされて構成されている。ネットワーク接続部27は、画像形成装置1をLANなどの外部ネットワークに接続する。これにより、画像形成装置1は、外部ネットワークに接続されているクライアントPCなどの外部装置と通信可能になる。画像形成装置1は、PCなどが接続された外部ネットワークに接続されている場合、そのPCなどから印刷ジョブを受信可能である。また、画像形成装置1は、上述の画像出力部23などにより、画像読取部5で読み取った画像データを、PCに送信したり、メールサーバなどを介してE−mailにより送信したりすることができる。なお、ネットワーク接続部27は、無線通信により外部ネットワークに接続可能に構成されていてもよい。
CPU11は、ROM15、RAM17、又は記憶部13などに記憶された制御プログラム13aなどを実行することにより、画像形成装置1の種々の動作を制御する。CPU11は、パネル操作部9から操作信号が送られたり、ネットワーク接続部27を介して通信可能なPCなどから操作コマンドが送信されたりすると、それらに応じて所定の制御プログラム13aを実行する。これにより、ユーザによるパネル操作部9の操作などに応じて、画像形成装置1の所定の機能が実行される。
[ファイル生成処理の説明]
本実施の形態において、画像読取部5で処理対象となる画像が読み込まれたときには、次のようにして、処理対象となる画像に対応するファイルを生成するファイル生成処理が行われる。なお、ここで「処理対象となる画像」とは、1つの画像でもよいし、複数の画像(例えば、複数ページの画像など)であってもよい。ファイル生成処理は、CPU11が、制御プログラム13aに基づいて画像処理部21を制御することで行われる。ファイル生成処理は、おおまかに、領域判別処理、グループ化処理、フォント情報の登録処理、情報埋め込み処理の各処理を含む。
[領域判別処理]
まず、領域判別処理により、処理対象となる画像の画像データに基づいて、文字属性データが生成される。このような処理は、従来より一般的に行われているものである。領域判別処理により、画像データ(BitMapなどのRGB形式に基づくデータ)と、画像形成装置1の独自仕様の文字属性データが保持される。文字属性データは、画像データのうち、文字である領域を示すデータであって、処理対象のうち文字属性を有する文字形状部分を示すデータである。これらのデータは、例えば、記憶部13に記憶される。
図3は、画像データ及び文字属性データの一例を示す。
図3においては、画像データ50を示すイメージと文字属性データ55を示すイメージとが示されている。画像データ50は、例えば、「WordArt」なる文字列56と、「警察消防」なる文字列58とを含んでいる。画像データ50は、背景51を背景に、上段に文字列56が配置され、下段に文字列58が配置されて構成されている。文字列56と文字列58とは、それぞれ、両端部に近づくほど文字の上下の寸法が大きくなるように、全体として湾曲するように変形された文字で構成されている。文字列56の色は例えば黒色であり、文字列58の色は例えば赤色である(図3においては斜線で示す)。
文字属性データ55は、画像データ50について領域判別処理を行うことで生成された、画像データ50に対応するデータである。文字属性データ55は、画像データ50中の文字属性を有する文字形状部分を示すデータである。図3においては、文字形状部分の輪郭が示されている。すなわち、文字属性データ55は、文字列56の輪郭形状と、文字列58の輪郭形状との情報を含むものである。
文字形状取得は、アウトラインフォントであれば文字のアウトライン形状を取得するが、形状のベクター化は公知であるためここでは詳細に記載しない。
[グループ化処理]
このように領域判別処理が行われると、文字形状部分を複数のグループに分離する分離処理(グループ化処理)が行われる。グループ化処理は、画像データ50及び文字属性データ55に基づいて行われる。グループ化処理は、以下の第1の条件及び第2の条件を満たすように行われる。
第1の条件は、グループのデータサイズを、画像形成装置1におけるフォント登録に関する仕様に適合し、かつ、文字形状に関する情報が欠損しないような大きさとすることである。一般的なアウトラインフォントを例に取ると、フォントのデータサイズは、アウトラインデータを構成するベジェ曲線の制御点の数に応じた大きさになる。また、文字の画素毎のオン、オフを示すデータで構成されるビットマップフォントでは、画素の数に応じた大きさのデータサイズになる。1つのグループの画像が大きくなると、そのグループの文字形状を正確に保持するためのデータサイズも大きくなり、画像形成装置1で取り扱うことができなくなる。グループのデータサイズを抑えるには、アウトラインフォントであれば制御点を減らして文字形状を単純化することが必要であり、ビットマップフォントであれば文字形状の微細な変化は丸め込んで低解像度化して画素を減らすことが必要である。しかしながら、この場合には、文字形状に関する情報の一部が欠落することになる。
第2の条件は、同じ文字色同士の文字形状部分をグループ化することである。
このような2つの条件を満たすようにするため、本実施の形態では、文字属性の連続領域をまず抽出し、その連続領域同士がある程度距離的に近接し、かつ文字色が同じ場合に1つのグループとなるように、グループ化処理が行われる。具体的には、グループ化処理は、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように行われる。このとき、文字色が同一であると判定された文字形状部分同士が、複数のグループに分離される。文字色が同一かどうかは、例えば、文字属性を有する部分の色空間距離が所定値未満であるか否かなど、所定の判断条件に基づいて判別される。文字色は、文字属性の連続領域が抽出されて文字属性データ55が生成され、対応する画像データ50を参照することで、容易に求めることができる。
図4は、グループ化処理の一例を示す図である。
図4においては、図3に示した画像データ50についてグループ化処理が行われた場合におけるグループの分離態様の一例が示されている。図4に示されるように、文字列56は、6つのグループ61〜66に分離される。すなわち、「WordArt」は、「W」(グループ61)、「o」(グループ62)、「r」(グループ63)、「d」(グループ64)、「A」(グループ65)、「rt」(グループ66)に分離される。また、文字列58は、5つのグループ71〜75に分離される。すなわち、「警察消防」は、「警」(グループ71)、「察」(グループ72)、「消」のへん(グループ73)、「肖(「消」のつくり)」(グループ74)、「防」(グループ75)に分離される。
このような例で示されるように、グループ化は、画像に含まれる文字の形状を保持するために行われる。すなわち、グループ化は、必ずしも各文字の意味が保持されるように行われなくてもよく、1文字単位のグループに分離されることは必要ではない。例えば、上述の例では、文字列56のうち「rt」は結合しているため、1つのグループ66として扱われる。また、文字列58のうち「消」はへんとつくりとが比較的離れているため、2つのグループ73,74に分離されて取り扱われる。
[フォント情報の登録]
グループ化処理が行われると、CPU11は、グループ毎に、他のグループと異なるコード情報(文字コード)を付与する。そして、グループの文字形状部分の形状情報と、そのグループに付与されたコード情報とを互いに関連付けて、フォント情報として登録する。コード情報としては、所定値以下のコード長を有するものが付与される。
図5は、コード情報の付与について説明する図である。
図5においては、上述のように分離されたグループ61〜66,71〜75についてのコード情報の付与例が示されている。図5に示されるように、コード情報は、その画像において一意に各グループを特定できるもの(他のグループに付与されるコード情報と重複しないもの)が付与される。例えば、グループ61〜66のそれぞれには、順に、「0x0000」〜「0x0005」がコード情報として付与される。また、グループ71〜75のそれぞれには、順に、「0x0006」〜「0x0009」、「0x000A」がコード情報として付与される。
このようにコード情報が付与されると、コード情報と、そのコード情報が付与されたグループに含まれる形状情報とが関連付けられる。これにより、コード情報に対応して、文字の形状を特定できるようになる。このとき登録した形状情報は、その画像についての独自のフォントとして取り扱うことができる。登録した形状情報とコード情報との組み合わせの1色には、独自のフォント名が付与される。
[情報の埋め込み]
フォント情報の登録が完了すると、CPU11は、画像データ50に基づいて、ファイルを生成する。ファイルには、例えば、画像データ50と、各グループの画像データ50内における位置を示す位置情報と、そのグループのコード情報とが埋め込まれる。また、本実施の形態においては、コード情報に対応する文字の色彩に関する情報や、登録されたフォント情報が、ファイルに埋め込まれる。なお、文字の色彩情報やフォント情報は、必ずしも位置情報が埋め込まれるファイルに埋め込まれなくてもよく、別のファイルとして生成されるようにしてもよい。
生成されるファイルにコード情報を埋め込む場合には、例えば次のようにすればよい。すなわち、ファイルの文字表示エリアを定義し、登録した独自のフォント名と、コード情報と、文字色と、位置とを文字(グループ)毎に指定する。指定は、例えば次に示すようにXML形式などで記載することができるが、これに限られるものではない。なお、各文字(グループ)のサイズについても指定するようにしてもよい。
<font name=”○○○○”/>(独自のフォント名を記載)
<color theme=”1”/>(文字色をテーマ別に記載、なお具体的に所定の表色系で色を指定してもよい。)
<coodinate.xxx=XXXXX>(位置(座標)を記載)
<”YYYYYYY”>(コード情報を記載)
図6は、1つの画像に関して生成されるファイルに埋め込まれる情報の例を示す図である。
図6に示されるように、ファイルには、例えば、コード情報(文字コード)、位置、色、サイズに関する情報が、各文字(コード情報単位)で埋め込まれる。すなわち、上述の画像データ50については、コード情報が「0x0000」〜「0x0009」,「0x000A」のそれぞれについて、このような情報が埋め込まれる。
以上のように生成されたファイルは、処理対象の画像に対応する画像を生成(構築)するための情報を含んでいる。すなわち、ファイルに含まれるコード情報及びそれと共に指定された情報に基づいて文字形状を画像データ50に合成することにより、元の処理対象の画像に対応する画像を構築することができる。
なお、ファイルを生成するとき、画像データ50に対応する文字コード等の情報を埋め込んでもよいし、画像データ50から文字形状部分の画像(文字画像)を消去した画像に文字コード等の情報を埋め込んでもよい。
図7は、文字画像の消去例を示す図である。
図7には、画像データ50について文字画像を消去した状態の画像が示されている。図7中の破線で囲んだ領域は、グループ61〜66,71〜75の位置を示している。文字画像の消去は、例えば、文字形状部分をその近傍の背景51aの色で塗りつぶすことにより行うことができる。なお、各グループ61〜66,71〜75の領域全体を、背景51aの色で塗りつぶすようにしてもよい。
画像データ50にフォント登録した文字を合成するとき、元々画像データ50にある文字画像と、合成する文字形状部分との微妙な位置ずれが発生すると、文字が太る可能性がある。しかしながら、このように文字画像を予め消去しておくことで、合成時に若干の位置ずれが発生しても、文字が太ることを防止できる。
上述のようなファイル生成処理の流れについて、フローチャートを参照しながら改めて説明する。
図8は、ファイル生成処理を説明するフローチャートである。
図8に示されるように、ファイル生成処理は、画像41(画像データ)と文字属性42(文字属性データ55)とのそれぞれについて進み、最終的に両データについての処理結果をまとめたファイルが生成される。一連の処理は、CPU11の制御に基づいて行われる。
ステップS101において、文字属性42について連続領域が検出される。
ステップS103において、連続領域が検出された文字属性42と、画像41とに基づいて、フォント登録処理が行われる。フォント登録処理は、後述のようにして行われる。
フォント登録処理が行われると、その結果に応じて、ステップS105の処理が行われる。ステップS105において、画像41について文字画像が消去される。
ステップS107において、文字画像が消去された画像41と、フォント登録処理の結果とに基づいて、ファイル生成が行われる。ファイルが生成されると、処理が終了する。
図9は、フォント登録処理を説明する第1のフローチャートである。
図9に示されるように、フォント登録処理がスタートすると、ステップS121において、文字領域の文字色が判定される。
ステップS122において、文字色が同一色である領域が検出される。
ステップS123において、文字領域の領域間の距離が規定値以下であるか否かが判別される。
ステップS123において規定値以下であれば、ステップS124において、領域間距離が規定値以下となる領域同士をひとまとまりに結合する。
ステップS123において規定値以下でないとき、及びステップS124の処理が終了したとき、ステップS125において、グループ化を行う。文字領域が、各領域のまとまり毎に、グループとして分離される。
ステップS126において、グループの数がカウントされる。
ステップS127において、グループの数が規定位置以下であるか否かを判別する。規定値以下であれば次の処理に進む。他方、グループの数が規定位置以下でなければ、ステップS128の処理に進む。
ステップS128において、領域間距離の閾値が若干拡大される。領域間距離が大きく設定される。領域間距離の閾値が変更されると、ステップS122からステップS127までの処理が繰り返される。
図10は、フォント登録処理を説明する第2のフローチャートである。
図10に示されるように、ステップS129において、各グループについてコード情報が付与される。コード情報が付与されると、グループに関する情報を利用して、画像41について文字画像の消去が行われる。
ステップS130において、各グループに含まれる文字形状が取得される。文字形状は、文字属性データを利用して取得される。
ステップS131において、取得された文字形状とコード情報とを用いて、フォント登録が行われる。
ステップS132において、各グループの画像41中での座標(位置情報)が取得される。取得された位置情報は、コード情報に基づいて、生成されるファイルに埋め込まれる。
グループの位置情報が取得されると、フォント登録処理が終了する。
以上説明したように、本実施の形態では、CPU11が、文字属性データを複数のグループに分解し、グループ毎に重複しないコード情報を割り当てる。そして、各グループについて、文字形状を抽出し、コード情報と対応付けてフォントとして登録する。この方法により生成されるファイルは、通常の文字コードを埋め込んだファイルと同じ構成を有するものとなる。したがって、生成されたファイルは、元々の画像における文字属性の情報を欠落させることなく、生成した他のアプリケーションや、プリンタドライバなどでの処理が可能なものとなる。プリンタドライバ等で他の画像形成装置(MFP)のBOX領域(記憶領域)に出力する(記憶させる)場合を考えると、埋め込まれたコード情報は、上記のように登録されたフォントの形状データに変換され、所定の形式のプリント用のファイル(PRN形式ファイルなど)に埋め込まれる。画像形成装置は、プリント用のファイルからラスタライズしたデータを生成する。このとき、文字にはテキスト(TEXT)属性が割り当てられる(プリント時の通常動作)。このようにテキスト属性の割り当てが行われることで、どの画素が文字領域であるかを正確に判断することができる。それにより、画質や機能性を損なうことなく、データを利用できる。
ここで、画像形成装置1の環境によっては、付与できるコード情報の数に制限がある。例えば、2byte文字を扱える環境であれば、1つのフォントが利用できる文字コードの数は、65536種類以下である。グループの数がこの数を超えると、各グループへの重複しないコード割り当てができなくなる。このような問題に対し、本実施の形態では、重複しないコードを処理対象の画像について生成できる数に応じて、グループ数の制限が行われる。グループ数の制限は、例えば、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで行われる。すなわち、上述の図9のステップS128における処理のように、領域間距離が変更されて大きくなると、若干離れている領域同士が結合されて1つのグループにまとめられるので、グループの数が低減する。したがって、確実に、処理対象の画像に対応する画像を構築できるファイルを生成できる。
なお、ファイルは処理対象の画像について生成されるところ、フォント登録も、その処理対象の画像において、複数のグループ一式について行われる。例えば、あるドキュメントの第1ページと第2ページとについて印刷指示を行う場合において、その2ページ分の画像が処理対象となる。このとき、処理対象となる画像について、重複しないコード割り当てができるかどうかに応じて、グループ数の制限が行われるようにすればよい。
また、グループ数の制限は、次のようにして行われてもよい。例えば、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、グループ数の制限を行うようにしてもよい。この場合、グループ化時に多少異なる文字色同士であっても同一のグループに含まれる。また、例えば、処理対象の画像を複数のページに分割することで、分割後のページの画像についてのグループ数が少なくなるようにしてもよい。この場合、分割したページ毎に、ファイルの生成を行うようにすればよい。
また、グループ数が多いときには、フォント情報を登録するときに、複数のフォントセットとして(複数のフォント名(「カスタムフォントA」、「カスタムフォントB」、…など)で)登録を行うようにしてもよい。この場合、フォント名とコード情報とで登録された文字形状を特定できるので、処理対象の画像に対応する画像を構築できる。
[第2の実施の形態]
第2の実施の形態における画像形成装置の基本的な構成は、第1の実施の形態におけるそれと同じであるためここでの説明を繰り返さない。第2の実施の形態においては、ファイル生成時にOCR処理を併せて行う点が、第1の実施の形態と異なる。
OCR処理によって文字形状が変化してしまう場合でも、文字の意味が保持されている場合には、さほど大きな問題にならない場面もある。一方、文字の誤判別が発生すると、文字の意味が破壊されてしまい、問題が大きくなる。一般的に、誤判別が生じるときには、OCRの信頼度が低くなる。第2の実施の形態では、OCR処理結果の信頼度を取得し、信頼度に応じて、ファイルの生成処理が行われる。なお、OCRの信頼度とは、OCR処理における辞書データとの一致率を示す指標であり、一般的に利用されているOCRエンジン毎に定義されている指標をいう。
より具体的には、CPU11は、OCR処理の結果、信頼度が高い場合には、そのままOCR処理の結果を利用して、文字コードを埋め込むことでファイルを生成する。他方、信頼度が低い場合には、画像データ中の文字を文字コードに変換せず、上述の第1の実施の形態と同様に、フォント登録処理等を行って、独自のコード情報を埋め込んでファイルを生成する。このような動作は、OCRを行う文字単位で行われる。
図11は、第2の実施の形態における画像形成装置1のファイル生成処理を示すフローチャートである。
図11に示されるように、ステップS201において、OCR処理を文字単位で行う。
ステップS203において、OCR処理の信頼度を取得する。
ステップS205において、信頼度が規定値以上であるか否かを判断する。
ステップS205において規定値以上であれば、ステップS207において、OCR処理の結果を利用して、その文字について文字コードの埋め込みを行う。
他方、ステップS205において規定値以上でなければ、ステップS209,S211,S213の処理が行われる。これらの処理は、上述の第1の実施の形態と同様にして、その文字について行われる。
ある文字について以上の処理が行われると、他の文字についても同様の処理が行われる。
各文字についての処理が完了すると、ステップS215において、ファイルの生成処理が行われる。ここで生成されるファイルについては、OCR処理の信頼度が高い文字についてOCR処理の結果を利用した文字コードが埋め込まれ、信頼度が低い文字については、第1の実施の形態と同様にフォント登録が行われた文字形状に対応するコード情報が埋め込まれたものとなる。
このように、第2の実施の形態においては、OCR処理を高い信頼度で行えるときにはOCR処理の結果を利用しつつ、OCR処理を適切に行うことが困難であるときにはフォント登録を行うことで、効率的にファイル生成を行うことができる。これにより、手書き文字や、ワードアートなどの任意形状の文字について、誤判別により意味が失われてしまうことを効率的に回避することができるようになる。
[その他]
なお、画像形成装置のハードウェア構成は上述に限られるものではなく、画像処理が種々の制御回路により行われるようにしてもよい。
このようなファイル生成処理は、画像形成装置の画像読取部で読み取られた画像を処理する場合に限られない。例えば、他の装置から送信された画像を画像形成装置で処理する場合にも、このようなファイル生成処理を適用可能である。
上述の実施の形態では、フォント登録を行い、生成するファイルには文字コードを埋め込むものであったが、ファイル自体に文字形状を埋め込むようにしてもよい(例えば、PDF/A形式など)。
画像形成装置としては、モノクロ/カラーの複写機、プリンタ、ファクシミリ装置やこれらの複合機(MFP)などいずれであってもよい。電子写真方式により画像を形成するものに限られず、例えばいわゆるインクジェット方式により画像を形成するものであってもよい。
また、本発明に係る画像処理装置は、画像形成装置に用いられるものに限られない。例えば、本発明は、画像データを読み取るスキャナ装置や、撮像装置や、画像データ送受信装置など、種々の装置に用いられる画像処理装置においても適用可能である。
上述の実施の形態における処理は、ソフトウェアによって行っても、ハードウェア回路を用いて行ってもよい。
上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD−ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。上記のフローチャートで文章で説明された処理は、そのプログラムに従ってCPUなどにより実行される。
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
1 画像形成装置(画像処理装置の一例、画像読取装置の一例)
3 画像形成部
5 画像読取部
11 CPU
13 記憶部
13a 制御プログラム
21 画像処理部

Claims (14)

  1. 処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置であって、
    前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離手段と、
    前記分離手段により分離されたグループ毎に、他のグループと異なるコード情報を付与する付与手段と、
    前記付与手段により付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録手段と、
    前記画像データと前記フォント登録手段により登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成手段とを備え、
    前記生成手段は、生成するファイルに、前記分離手段により分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置。
  2. 前記付与手段は、前記コード情報として、所定値以下のコード長を有するものを付与する、請求項1に記載の画像処理装置。
  3. 前記分離手段は、前記画像データに基づいて、他の文字形状部分から所定の距離以内にある文字形状部分同士が同一のグループに含まれるように、前記分離を行う、請求項1又は2に記載の画像処理装置。
  4. 前記分離手段は、前記画像データ及び前記文字属性データに基づいて、所定の判断条件に基づいて文字色が同一であると判定された文字形状部分を複数のグループに分離する、請求項1から3のいずれかに記載の画像処理装置。
  5. 前記分離手段は、重複しないコードを処理対象の画像について生成できる数に応じてグループ数の制限を行う、請求項1から4のいずれかに記載の画像処理装置。
  6. 前記分離手段は、互いに同一のグループとする文字形状部分間の距離条件を緩和し、グループの大きさを拡大することで、前記グループ数の制限を行う、請求項5に記載の画像処理装置。
  7. 前記分離手段は、互いに同一のグループとする文字形状の色彩の色空間距離条件を緩和し、グループの大きさを拡大することで、前記グループ数の制限を行う、請求項5又は6に記載の画像処理装置。
  8. 前記分離手段は、処理対象の画像を複数のページに分割することで、分割後のページの画像についての前記グループ数の制限を行う、請求項5から7のいずれかに記載の画像処理装置。
  9. 前記生成手段は、生成するファイルに、前記コード情報とともに、前記コード情報に対応する文字の色彩に関する情報を埋め込む、請求項1から8のいずれかに記載の画像処理装置。
  10. 前記生成手段は、生成するファイルに、前記コード情報とともに、前記コード情報に関する文字の形状に関する情報を埋め込む、請求項1から9のいずれかに記載の画像処理装置。
  11. 前記画像データについてOCR(光学式文字読取)処理を行うOCR処理手段と、
    前記OCR処理手段によるOCR処理結果の信頼度を取得する信頼度取得手段とをさらに備え、
    前記生成手段は、前記信頼度取得手段により取得された信頼度に応じて、前記ファイルの生成を行う、請求項1から10のいずれかに記載の画像処理装置。
  12. 請求項1から11のいずれかに記載の画像処理装置と、
    原稿を読み取って画像を生成する読取手段とを備え、
    前記画像処理装置は、前記読取手段により生成された画像を処理対象として、その画像に対応するファイルを生成する、画像読取装置。
  13. 処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置の制御方法であって、
    前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、
    前記分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、
    前記付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、
    前記画像データと前記フォント登録ステップにより登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとを備え、
    前記生成ステップは、生成するファイルに、前記分離ステップにより分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置の制御方法。
  14. 処理対象の画像に対応する画像データと前記画像のうち文字属性を有する文字形状部分を示す文字属性データとを記憶部に記憶し、前記記憶部に記憶されたデータを用いて前記処理対象の画像に対応するファイルを生成する画像処理装置の制御プログラムであって、
    前記文字属性データに基づいて、前記文字属性を有する文字形状部分を複数のグループに分離する分離ステップと、
    前記分離ステップにより分離されたグループ毎に、他のグループと異なるコード情報を付与する付与ステップと、
    前記付与ステップにより付与されたコード情報と、そのコード情報に対応するグループの文字形状部分に関する情報とを関連付けて、フォント情報として登録するフォント登録ステップと、
    前記画像データと前記フォント登録ステップにより登録されたフォント情報とに基づいて、前記処理対象の画像に対応する画像を生成するための情報を含むファイルを生成する生成ステップとをコンピュータに実行させ、
    前記生成ステップは、生成するファイルに、前記分離ステップにより分離された各グループの前記画像データ内における位置を示す位置情報及びそのグループのコード情報を埋め込む、画像処理装置の制御プログラム。
JP2013111927A 2013-05-28 2013-05-28 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム Active JP6119427B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013111927A JP6119427B2 (ja) 2013-05-28 2013-05-28 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013111927A JP6119427B2 (ja) 2013-05-28 2013-05-28 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2014232930A true JP2014232930A (ja) 2014-12-11
JP6119427B2 JP6119427B2 (ja) 2017-04-26

Family

ID=52126101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013111927A Active JP6119427B2 (ja) 2013-05-28 2013-05-28 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム

Country Status (1)

Country Link
JP (1) JP6119427B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157348A (zh) * 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 生成验证码图片的方法及装置、校验验证码的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004334A (ja) * 2003-06-10 2005-01-06 Ricoh Co Ltd 画像処理装置、画像処理方法及び該方法の実行に用いるプログラム
JP2009060498A (ja) * 2007-09-03 2009-03-19 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2009094955A (ja) * 2007-10-11 2009-04-30 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2009284171A (ja) * 2008-05-21 2009-12-03 Canon Inc 画像処理装置及び画像処理方法ならびに画像処理方法を実行するプログラム、記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004334A (ja) * 2003-06-10 2005-01-06 Ricoh Co Ltd 画像処理装置、画像処理方法及び該方法の実行に用いるプログラム
JP2009060498A (ja) * 2007-09-03 2009-03-19 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2009094955A (ja) * 2007-10-11 2009-04-30 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2009284171A (ja) * 2008-05-21 2009-12-03 Canon Inc 画像処理装置及び画像処理方法ならびに画像処理方法を実行するプログラム、記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157348A (zh) * 2015-03-30 2016-11-23 阿里巴巴集团控股有限公司 生成验证码图片的方法及装置、校验验证码的方法及装置

Also Published As

Publication number Publication date
JP6119427B2 (ja) 2017-04-26

Similar Documents

Publication Publication Date Title
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
US8542953B2 (en) Image processing apparatus and image processing method
US8131081B2 (en) Image processing apparatus, and computer program product
US20070146791A1 (en) Printing apparatus, printing system, printing method, program, and storage medium
US8760675B2 (en) Image reading apparatus and image reading system having a reading preference input operation
EP3147810B1 (en) Image processing apparatus and program
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US8314964B2 (en) Image processing apparatus and image processing method
US9866725B2 (en) Image processing system, information processing apparatus, and recordable medium
JP5672953B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US10264151B2 (en) Information processing device, image processing system and non-transitory computer readable medium storing program
JP7262993B2 (ja) 画像処理システム、画像処理方法、画像処理装置
US11115544B2 (en) Information processing apparatus, character recognition method and non-transitory computer-readable recording medium encoded with character recognition instructions
JP5570193B2 (ja) 画像管理装置、および画像管理方法
US9614984B2 (en) Electronic document generation system and recording medium
US20180270387A1 (en) Printing apparatus, server, printing method, and control method
JP4943354B2 (ja) 情報識別装置、情報識別方法、プログラム及び記録媒体
JP2015028730A (ja) 印刷システム、その制御方法、及びプログラム、並びに印刷サーバ、その制御方法、及びプログラム
JP6119427B2 (ja) 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム
JP2006196976A (ja) Ocrによる自動清書機能を持つ複写システム
JP2020067959A (ja) 画像処理装置、その制御方法及びプログラム
JP4950835B2 (ja) 画像形成装置及び画像形成装置の制御方法及びプログラム及び記憶媒体
US20210097271A1 (en) Character recognition using previous recognition result of similar character
JP2015159427A (ja) 画像読取装置、画像読取装置の制御方法及び制御プログラム
JP2010109653A (ja) 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170313

R150 Certificate of patent or registration of utility model

Ref document number: 6119427

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150