JP4338155B2 - 画像処理装置及びその方法、コンピュータ可読メモリ - Google Patents
画像処理装置及びその方法、コンピュータ可読メモリ Download PDFInfo
- Publication number
- JP4338155B2 JP4338155B2 JP13150999A JP13150999A JP4338155B2 JP 4338155 B2 JP4338155 B2 JP 4338155B2 JP 13150999 A JP13150999 A JP 13150999A JP 13150999 A JP13150999 A JP 13150999A JP 4338155 B2 JP4338155 B2 JP 4338155B2
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- image
- character recognition
- document
- types
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Description
【発明の属する技術分野】
本発明は、画像処理装置及びその方法、コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】
従来の文字認識機能を有する画像処理装置は、基本的に単一解像度の二値画像を認識対象としていた。一方、文字認識の精度は一般的に入力画像の解像度と密接な関係にあることが判明している。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の画像処理装置は、単一解像度の画像を対象としていたため、認識精度の観点から見れば、常に最適な条件で文字認識を行える環境にあるとは言い難かった。
【0004】
本発明は上記の問題点に鑑みてなされたものであり、文字認識精度を向上することができる画像処理装置及びその方法、コンピュータ可読メモリを提供することを目的とする。
【0005】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報を保存する保存手段と
を備える。
【0006】
また、好ましくは、前記保存手段により保存された最適解像度の情報に基づいて、前記画像ファイルに含まれる前記最適解像度の原稿画像の文字認識を行う認識手段と、
前記認識手段による認識結果を出力する出力手段と
を更に備える。
【0007】
また、好ましくは、前記保存手段は、前記最適解像度の情報を前記画像ファイル内に保存する。
【0008】
また、好ましくは、入力された原稿画像を複数種類の解像度の原稿画像に変換し、当該変換された複数種類の解像度の原稿画像を含む所定のフォーマットの画像ファイルを生成する変換手段を更に備える
【0009】
また、好ましくは、前記所定のフォーマットは、FlashPixまたはCIFFである。
【0010】
また、好ましくは、前記判定手段は、前記画像ファイルに含まれる各解像度の原稿画像における所定領域に対して文字認識を実行し、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、前記最適解像度の原稿画像として判定する。
【0011】
また、好ましくは、前記所定領域は、前記原稿画像に含まれるテキストブロックのうちの最初のブロックである。
【0013】
また、好ましくは、前記判定手段は、前記画像ファイルに含まれる複数の解像度の原稿画像に対して、当該解像度が低い方から高い方、あるいは高い方から低い方のいずれかの順で、順次文字認識を実行していき、前記平均相関値がピークを示したと判断すると当該文字認識を停止し、当該ピークを示した際の解像度を前記最適解像度として判定する。
【0015】
上記の目的を達成するための本発明による画像処理方法は以下の構成を備える。即ち、
画像処理装置の判定手段が、複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定工程と、
画像処理装置の保存手段が、前記判定工程で判定された最適解像度の情報を保存する保存工程と
を備える。
【0016】
上記の目的を達成するための本発明によるコンピュータ可読記憶媒体は以下の構成を備える。即ち、
複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報をメモリに保存する保存手段
としてコンピュータを機能させるためのコンピュータプログラムを格納した、コンピュータ可読記憶媒体。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
[実施形態1]
図1は本発明による画像処理装置の機能的構成を示すブロック図である。
【0021】
図1において、2は原稿画像を入力するスキャナである。尚、原稿画像の入力は、スキャナ2に限定されず、デジタルカメラ、記憶装置等に記憶された画像を入力するような構成にしても良い。4はスキャナ2で入力された画像を、画像のファイルフォーマットの1つであるFlashPix(フラッシュピクス)画像に変換するFlashPix展開部である。6はFlashPix展開部4で変換されたFlashPix画像を保存する画像メモリである。
【0022】
8は画像メモリ6に保存された画像より文字認識に最適な解像度を判定する文字認識最適解像度判定回路である。10は文字認識最適解像度判定回路8の判定結果に基づいて、画像メモリ6に蓄積された画像より最終的な文字認識を行う文字認識回路である。12は文字認識回路10の認識結果を、記憶装置、プリンタ、ディスプレイ、ネットワーク等に出力する出力回路である。
【0023】
ここで、FlashPix画像のファイルフォーマットについて簡単に説明する。
【0024】
FlashPix(米国Eastman Kodak社の登録商標)ファイルフォーマットの画像ファイルでは、画像ヘッダ部に格納されている画像属性情報および画像データをさらに構造化して画像ファイル内に格納する。この構造化した画像ファイルを、図4、図5に示す。
【0025】
画像ファイル内の各プロパティや画像データには、MS−DOSのディレクトリとファイルに相当する、ストレージとストリームによって管理する。図4、図5において、陰付き部分がストレージであり、陰なし部分がストリームである。画像データや画像属性情報は、ストリームに格納される。画像データは異なる解像度で階層化されており、それぞれの解像度の画像をSubimageと呼び、その解像度Resolution0,1,…,n−1,nで示してある。各解像度の画像に対して、その画像を読み出すために必要な情報がSubimage Headerに、また、画像データがSubimage dataに格納される。
【0026】
プロパティセット(Property Set)とは、属性情報をその使用目的、内容に応じて分類して定義したものであり、Summary Info. Property Set,Image Info. Property Set,Image Content Property Set,Extension list property Setがある。
【0027】
[各プロパティセットの説明]
Summary Info. Property Setは、FlashPix特有のものではなく、例えば、Microsoft社のストラクチャードストレージでは、必須のプロパティセットであり、その画像ファイルのタイトル・題名・著者・サムネール画像等の情報を格納する。
【0028】
Image Contents Property Setは、画像データの格納方法を記述する属性である。この属性には、画像データの階層数、最大解像度の画像の幅、高さ、色の構成や、それぞれの解像度の画像についての幅、高さ、色の構成、あるいはJPEG圧縮を用いる際の量子化テーブル・ハフマンテーブルの定義を記述する。Image Contents Property Setの一例を、図8に示す。
【0029】
Image Info. Property Setは、画像を使用する際に利用できるさまざまな情報、例えば、その画像がどのようにして取り込まれ、どのように利用可能であるか等の情報を格納する。これらの情報の一例を挙げると以下のようになる。
【0030】
・デジタルデータの取り組み方法/あるいは生成方法に関する情報(File Source)
・著作権に関する情報(Intellectual property)
・画像の内容(画像中の人物、場所など)に関する情報(Content description)
・撮影に使われたカメラに関する情報(Camera information)
・撮影時のカメラのセッティング(露出、シャッタースピード、焦点距離、フラッシュ使用の有無など)の情報(Per Picture camera settings)
・デジタルカメラ特有解像度やモザイクフィルタに関する情報(Digital camera characterization)
・フィルムのメーカ名、製品名、種類(ネガ・ポジ、カラー/白黒)などの情報(Film description)
・オリジナルが書物や印刷物である場合の種類やサイズに関する情報(Original document scan description)
・スキャン画像の場合、使用したスキャナやソフト、操作した人に関する情報(Scan device)
Extension list Property Setは、FlashPixの基本仕様に含まれない情報を追加する際に使用する領域である
図5に示すFlashPix Image View Objectは、画像を表示する際に用いるビューイングパラメータと画像データをあわせて格納する画像ファイルである。ビューイングパラメータとは、画像の回転、拡大/縮小、移動、色変換、フィルタリングの処理を画像表示の際に適応するために記憶しておく処理係数のセットである。
【0031】
Source/Result FlashPix Image Objectは、FlashPix画像の実体であり、Source FlashPix Image Objectは必須、Result FlashPix Image Objectはオプションである。Source FlashPix Image Objectはオリジナルの画像を、Result FlashPix Image Objectはビューイングパラメータ使って画像処理した画像を格納する。 Source/Result desc. Property setは、上記画像データの識別のためのプロパティセットであり、画像ID、変更禁止のプロパティセット、最終更新日時等の情報を格納する。
【0032】
Transform property setは、回転、拡大/縮小、移動のためのAffine変換係数、色変換マトリクス、コントラスト調整値、フィルタリング係数等の情報を格納している。
【0033】
次に、画像データの取り扱いについて説明する。
【0034】
図6に解像度の異なる複数の画像から構成される画像ファイルの例を示す。
【0035】
図6において、最大解像度の画像は列×行がC×Rで構成されており、その次に大きい画像はC/2×R/2であり、それ以降順次、列・行ともに1/2ずつ縮小し、列・行ともに64画素以下あるいは等しくなるまで繰り返す。
【0036】
このように階層化した結果、画像の属性情報として「1つの画像ファイル中の階層数」やそれぞれの階層の画像に対して、上述ヘッダ情報と画像データが必要となる。1つの画像ファイル中の階層の数や最大解像度の画像の幅、高さ、あるいはそれぞれの解像度の画像の幅、高さ、色構成、圧縮方式等に関する情報は、上記Image Contents Property Setとして、図8に示すように記述される。
【0037】
更に、各解像度の画像は、図7に示すように64×64のタイルに分割されている。画像の左上部から順次64×64のタイルに分割をすると、画像によっては、右端および下端のタイルの一部に空白が生ずる場合がある。この場合はそれぞれ最右端画像または最下端画像を繰り返し挿入することで、64×64画素を構築する。FlashuPixでは、それぞれのタイル中の画像をJPEG圧縮、シングルカラー、非圧縮のいずれかの方法で格納する。尚、JPEG圧縮は、ISO/IEC JTC1/SC29により国際標準化された画像圧縮方式であり、方式自体の説明はここでは割愛する。また、シングルカラーとは、前記1つのタイルがすべて同じ色で構成されている場合にのみ、個々の画素の値を記録することなく、そのタイルの色を1色で表現する方式である。この方式は、特に、コンピュータグラフィックスにより生成された画像に有効である。
【0038】
このように、タイル分割された画像データはSubimage dataストリーム中に格納され、タイルの総数、個々のタイルのサイズ、データの開始位置、圧縮方法はすべてSubimage headerに格納されている。このSubimage headerの一例を、図9に示す。
【0039】
次に、上記図1の構成で実行される動作について説明する。
【0040】
スキャナ2から入力された画像は、FlashPix展開部4においてFlashPix画像に変換され、画像メモリ6に蓄積される。次に、文字認識最適解像度判定回路8において、まず、画像メモリ6より各解像度における画像の所定の部分の読取りを行い、それぞれ文字認識を行う。続いて、各文字認識結果より最適文字認識解像度を求める。
【0041】
文字認識回路10においては、文字認識最適解像度判定回路8において求められた最適解像度の画像を、改めて画像メモリ6より読み出し、その画像全体に対し文字認識を行う。文字認識最適解像度判定回路8と文字認識回路10の動作の詳細については後述する。出力回路12では、文字認識回路10による文字認識結果を出力形態(ファイル、プリンタ、ディスプレイ、ネットワーク等)に合わせて変換して出力する。
【0042】
図10は本発明に係る画像処理装置のハードウェア構成を示す図である。
【0043】
図10における各種構成について、図1の各構成との関連も含めて説明する。
101はCPU(中央処理装置)であり、メモリ(MEM)102や外部記憶媒体103に格納されているプログラムコードに従って各種処理を実行する。後述するフローチャートに示す処理も、CPU101の制御に基づいて実行される。また、FlashPix展開部4、文字認識最適解像度判定回路8、文字認識回路10も、このCPU101により実現する。
【0044】
102はROM及びRAMからなるメモリであり、画像入力装置104により入力、外部記憶媒体103から読み取り、あるいは通信I/F108により通信回線を介して他の端末から入力した画像、FlashPix等のファイルフォーマットに変換された画像データ、文字認識回路10による文字認識で用いる文字辞書データ、認識結果の候補文字群、後述する処理で用いる各種パラメータ等を記憶する。また、処理中のデータを格納するためのワーキングメモリの領域を備える。画像メモリ6は、このメモリ102により実現する。
【0045】
103はCD−ROM、CD−R、FD等の本装置に着脱可能な外部記憶媒体であって、画像や制御プログラムのプログラムコード、処理結果の画像ファイルやテキスト等を記憶あるいは読み出すことができる。104は原稿の画像を光学的に読み取るスキャナやデジタルカメラ等の画像入力装置であり、スキャナ2はこの画像入力装置104に対応する。105はCRTや液晶表示器等の表示器であって、画像、テキスト、処理途中のメッセージ等を表示する。キーボード107により入力されたデータや操作画面も表示器105により表示する。
【0046】
106はLBP(レーザビームプリンタ)やインクジェットプリンタ等のプリンタであり、画像やテキスト等を記録する。107はキーボードであり、オペレータの操作により、各種コマンドや文字コード等を入力することができる。キーボード107の代わりに、あるいは加えてマウスやタブレット等の座標データを入力できる座標入力装置を備えても良い。108は通信I/Fであり、通信回線(公衆回線あるいはLAN)を介して他の端末とデータあるいはコマンド等の送受信を行う。109はバスであり、各種構成要素間でのデータあるいはコマンド等を相互に通信可能とする。
【0047】
次に、文字認識最適解像度判定回路8と文字認識回路10で実行される処理の詳細について、それぞれ図2、図3を用いて説明する。
【0048】
図2は本発明の実施形態1の文字認識最適解像度判定回路で実行される処理の詳細を示すフローチャートである。
【0049】
ステップS202において、ステップS204で読み込むFlashPix画像の読み取り解像度を格納するメモリ102中の読み取り解像度パラメータを、処理対象となっているFlashPix画像の中の最高の解像度に設定する。次に、ステップS204で、画像メモリ6に記憶されているFlashPix画像の読み取り解像度パラメータが示す解像度の画像の所定領域を読み出す。ここで、所定領域とは、例えば、画像に含まれるテキストブロックの中の最初のブロックとする。ステップS206で、読み出した画像を二値化する。次に、ステップS208で、二値化された画像に対し、文字認識回路10による文字切り、相関演算の一連の文字認識作業を行う。ステップS210において、ステップS204で読み込んだ画像に対する文字認識の評価値である文字毎の相関値の平均相関値を求める。この平均相関値は、例えば、ステップS208で文字認識した結果として得られる第1候補文字の類似度を全て加算し、文字数で割った値とする。求めた平均相関値は画像の解像度に対応づけてメモリ102に格納する。
【0050】
ステップS212で、処理対象となっているFlashPix画像の最低解像度まですべての解像度の画像に対してステップS204〜ステップS210の平均相関値を求める処理を行ったか否かを判定する。すべての解像度の画像における平均相関値を求めていないと判定される場合(ステップS212でNO)、ステップS214へ進み、現在読み取り解像度パラメータに設定されている解像度を1ランク下げてメモリ102に設定し、ステップS204に戻る。一方、すべての解像度における平均相関値を求めていると判定された場合(ステップS212でYES)、ステップS216に進み、メモリ102に格納されているすべての解像度の画像に対する平均相関値の中から最大値を検索し、その最大値を得た画像の解像度を文字認識最適解像度とメモリ102に設定して処理を終了する。
【0051】
ここで、検索した最大値が、メモリ102に予め格納してあるしきい値を満たさない、即ち、類似度が低い場合は、ステップS204で読み出す領域を別の領域(例えば、2番目に切り出されるテキストブロック)に変えて、ステップS202〜ステップS216の処理を繰り返しても良い。また、ステップS216で求めた文字認識最適解像度のデータは、FlashPix画像の中に格納しても良い。
【0052】
図3は本発明の実施形態1の文字認識回路で実行される処理の詳細を示すフローチャートである。
【0053】
ステップS302で、文字認識最適解像度判定回路8でメモリ102に格納された文字認識最適解像度を読み取る。次に、ステップS304で、読み取られた文字認識最適解像度のFlashPix画像を画像メモリ6より読み取る。ステップS306で、画像メモリ6より読み取られた画像全体に対し、文字認識回路10により文字認識を行う。認識結果のテキストは、FlashPix画像のファイルフォーマットで格納しても良いし、表示器105、プリンタ106、通信I/F108より出力しても良い。
【0054】
以上説明したように、実施形態1によれば、文字認識最適解像度判定回路8により、文字認識に最適な解像度をあらかじめ判定することが可能となり、その判定された解像度のFlashPix画像を用いて文字認識を行うことにより、文字認識精度を飛躍的に向上させることが可能となる。
[実施形態2]
実施形態1の文字認識最適解像度判定回路6では、画像の一部の領域を抽出して文字認識最適解像度の判定を行っていたが、本発明はこれに限定されるものではない。例えば、文字認識対象の画像が複数ページからなるマルチページの画像である場合、その第1ページを抽出して、文字認識最適解像度の判定を行い、この判定された文字認識最適解像度で全ページの画像を文字認識するような構成にしても良い。
【0055】
尚、実施形態1、2においては、FlashPix画像を用いる例について説明したが、本発明はこれに限定されるものではなく、CIFF(Canon Image Format File)(キヤノン社の登録商標)等、複数の解像度の画像を記憶、あるいは生成できる他のフォーマットデータであっても良いことは勿論である。
【0056】
尚、実施形態1においては、ステップS202において読み取り解像度を最高レベルに設定し、ステップS214において順次解像度を落としながら文字認識最適解像度判定を行う例について説明したが、本発明はこれに限るものではない。例えば、ステップS202において読み取り解像度を最低レベルに設定し、ステップS214において順次解像度のレベルを一ランクずつ上げながら全ての解像度でのチェックを行い、文字認識最適解像度判定を行っても良い。
【0057】
また、実施形態1においては、ステップS216において全解像度の画像から得られた平均相関値の最大値を検索し、その最大値を得た解像度を文字認識最適解像度として決定していたが、本発明はこれに限るものではない。例えば、各解像度で得た平均相関値の履歴を監視し、ステップS210で求めた値がピークを示した時点でその値を得た画像の解像度を文字認識最適解像度として決定し、次の解像度の画像の平均相関値を演算する処理を停止しても良い。図11は、最低レベルの解像度の画像から順次平均相関値を求めた場合の平均相関値の履歴を示す図であって、1104を求めた時点で1103がピークであることが認識され、演算を停止する。
【0058】
以上説明したように、上記実施形態1、2では、同一画像で複数の解像度において文字認識精度の判定を行い、その判定結果に基づき最高精度の解像度の画像を選択して文字認識を行うことができるので、文字認識精度を飛躍的に向上させることが可能となる。
【0059】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0060】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。前述のフローチャートにより説明した各処理ステップは、このプログラムコードに従って、CPUの制御のもと実行されるものである。
【0061】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0062】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0063】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0064】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0065】
【発明の効果】
以上説明したように、本発明によれば、文字認識精度を向上することができる画像処理装置及びその方法、コンピュータ可読メモリを提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態1の画像処理装置の機能的構成を示すブロック図である。
【図2】本発明の実施形態1の文字認識最適解像度判定回路で実行される処理の詳細を示すフローチャートである。
【図3】本発明の実施形態1の文字認識回路で実行される処理の詳細を示すフローチャートである。
【図4】構造化された画像ファイルの一例を示す図である。
【図5】構造化された画像ファイルの一例を示す図である。
【図6】解像度の異なる複数の画像から構成される画像ファイルの一例を示す図である。
【図7】タイル分割の一例を示す図である。
【図8】 Image Contents Property Setの一例を示す図である。
【図9】 Subimage headerの一例を示す図である。
【図10】本発明に係る画像処理装置のハードウェア構成を示す図である。
【図11】平均相関値の履歴を示す図である。
【符号の説明】
2 スキャナ
4 FlashPix展開部
6 画像メモリ
8 文字認識最適解像度判定回路
10 文字認識回路
12 出力回路
Claims (10)
- 複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報を保存する保存手段と
を備えることを特徴とする画像処理装置。 - 前記保存手段により保存された最適解像度の情報に基づいて、前記画像ファイルに含まれる前記最適解像度の原稿画像の文字認識を行う認識手段と、
前記認識手段による認識結果を出力する出力手段と
を更に備えることを特徴とする請求項1に記載の画像処理装置。 - 前記保存手段は、前記最適解像度の情報を前記画像ファイル内に保存する
ことを特徴とする請求項1に記載の画像処理装置。 - 入力された原稿画像を複数種類の解像度の原稿画像に変換し、当該変換された複数種類の解像度の原稿画像を含む所定のフォーマットの画像ファイルを生成する変換手段を更に備える
ことを特徴とする請求項1に記載の画像処理装置。 - 前記所定のフォーマットは、FlashPixまたはCIFFである
ことを特徴とする請求項1に記載の画像処理装置。 - 前記判定手段は、前記画像ファイルに含まれる各解像度の原稿画像における所定領域に対して文字認識を実行し、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、前記最適解像度の原稿画像として判定する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記所定領域は、前記原稿画像に含まれるテキストブロックのうちの最初のブロックである
ことを特徴とする請求項6に記載の画像処理装置。 - 前記判定手段は、前記画像ファイルに含まれる複数の解像度の原稿画像に対して、当該解像度が低い方から高い方、あるいは高い方から低い方のいずれかの順で、順次文字認識を実行していき、前記平均相関値がピークを示したと判断すると当該文字認識を停止し、当該ピークを示した際の解像度を前記最適解像度として判定する
ことを特徴とする請求項1に記載の画像処理装置。 - 画像処理装置の判定手段が、複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定工程と、
画像処理装置の保存手段が、前記判定工程で判定された最適解像度の情報を保存する保存工程と
を備えることを特徴とする画像処理方法。 - 複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報をメモリに保存する保存手段
としてコンピュータを機能させるためのコンピュータプログラムを格納した、コンピュータ可読記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13150999A JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
DE69942165T DE69942165D1 (de) | 1998-06-12 | 1999-06-08 | Bildverarbeitungsgerät und computerlesbarer Speicher |
EP99304479A EP0964353B1 (en) | 1998-06-12 | 1999-06-08 | Image processing apparatus and method, and computer-readable memory |
US09/329,202 US6668101B2 (en) | 1998-06-12 | 1999-06-10 | Image processing apparatus and method, and computer-readable memory |
CNB991083679A CN1149509C (zh) | 1998-06-12 | 1999-06-11 | 图像处理设备和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16530298 | 1998-06-12 | ||
JP10-165302 | 1998-06-12 | ||
JP13150999A JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000067155A JP2000067155A (ja) | 2000-03-03 |
JP2000067155A5 JP2000067155A5 (ja) | 2006-07-06 |
JP4338155B2 true JP4338155B2 (ja) | 2009-10-07 |
Family
ID=26466328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13150999A Expired - Fee Related JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
Country Status (5)
Country | Link |
---|---|
US (1) | US6668101B2 (ja) |
EP (1) | EP0964353B1 (ja) |
JP (1) | JP4338155B2 (ja) |
CN (1) | CN1149509C (ja) |
DE (1) | DE69942165D1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891972B2 (en) * | 1997-12-19 | 2005-05-10 | Canon Kabushiki Kaisha | Communication system and control method thereof, and computer-readable memory |
US20010019424A1 (en) * | 2000-03-06 | 2001-09-06 | Takenori Idehara | Image-forming devices portable telephones, image-processing devices, image-processing methods, and computer program product |
CN1305006C (zh) * | 2001-07-12 | 2007-03-14 | 杜莱布斯公司 | 向图象处理装置提供格式化信息的方法和系统 |
FR2827459B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir a des logiciels de traitement d'image des informations formatees liees aux caracteristiques des appareils de capture d'image et/ou des moyens de restitution d'image |
FR2827460B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir, selon un format standard, a des logiciels de traitement d'images des informations liees aux caracteristiques des appareils de capture d'image et/ou des moyens de resti |
JP4159986B2 (ja) | 2001-07-12 | 2008-10-01 | ドゥ ラブズ | デジタル画像から変換された画像を計算するための方法およびシステム |
US6922487B2 (en) * | 2001-11-02 | 2005-07-26 | Xerox Corporation | Method and apparatus for capturing text images |
US7343052B2 (en) * | 2002-04-09 | 2008-03-11 | Sonic Solutions | End-user-navigable set of zoomed-in images derived from a high-resolution master image |
US20040047519A1 (en) * | 2002-09-05 | 2004-03-11 | Axs Technologies | Dynamic image repurposing apparatus and method |
JP4064196B2 (ja) * | 2002-10-03 | 2008-03-19 | 株式会社リコー | クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法 |
FR2851357B1 (fr) * | 2003-02-19 | 2005-04-22 | Solystic | Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images |
US20040210444A1 (en) * | 2003-04-17 | 2004-10-21 | International Business Machines Corporation | System and method for translating languages using portable display device |
JP2005084948A (ja) * | 2003-09-09 | 2005-03-31 | Hitachi Ltd | 情報処理装置、情報処理方法及び情報処理システム |
FR2899359B1 (fr) * | 2006-03-28 | 2008-09-26 | Solystic Sas | Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux |
US8098934B2 (en) | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
US7953295B2 (en) * | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
JP4986279B2 (ja) * | 2006-09-08 | 2012-07-25 | 任天堂株式会社 | ゲームプログラムおよびゲーム装置 |
US8000554B2 (en) * | 2007-04-04 | 2011-08-16 | Xerox Corporation | Automatic dynamic range adjustment in digital imaging |
US8611661B2 (en) * | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
US7933473B2 (en) * | 2008-06-24 | 2011-04-26 | Microsoft Corporation | Multiple resolution image storage |
US8064733B2 (en) * | 2008-06-24 | 2011-11-22 | Microsoft Corporation | Variable resolution images |
US7983512B2 (en) * | 2008-06-24 | 2011-07-19 | Microsoft Corporation | Embedding large images within one another |
JP5683367B2 (ja) * | 2011-04-20 | 2015-03-11 | キヤノン株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
CN103136559B (zh) * | 2011-11-30 | 2016-01-20 | 北大方正集团有限公司 | 可变条码的光栅化方法和装置 |
CN102567947A (zh) * | 2012-01-12 | 2012-07-11 | 惠州Tcl移动通信有限公司 | 一种移动终端中图像处理方法及移动终端 |
GB201203883D0 (en) * | 2012-03-05 | 2012-04-18 | King S College London | Method and system to assist 2D-3D image registration |
JP6049437B2 (ja) | 2012-12-14 | 2016-12-21 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP6001008B2 (ja) * | 2014-06-06 | 2016-10-05 | キヤノン株式会社 | 画像読取装置、画像読取装置の制御方法、プログラム、及び記憶媒体 |
JP6705984B2 (ja) * | 2015-03-31 | 2020-06-03 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
WO2017079696A1 (en) * | 2015-11-06 | 2017-05-11 | California Institute Of Technology | Devices and methods for direct visual detection and readout of single nucleic acid molecules |
JP6596512B2 (ja) | 2015-12-25 | 2019-10-23 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
JP7326779B2 (ja) * | 2019-03-11 | 2023-08-16 | 富士フイルムビジネスイノベーション株式会社 | 画像形成装置及びプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5943480A (ja) * | 1982-09-03 | 1984-03-10 | Ricoh Co Ltd | 文字認識方法 |
DE68928703T2 (de) * | 1988-07-20 | 1998-12-10 | Fujitsu Ltd | Buchstabenerkennungsvorrichtung |
US5361309A (en) * | 1989-09-07 | 1994-11-01 | Canon Kabushiki Kaisha | Character recognition apparatus and method with low-resolution storage for character extraction |
US5309548A (en) * | 1989-09-21 | 1994-05-03 | Canon Kabushiki Kaisha | Pattern generating method and apparatus |
CA2036974C (en) * | 1990-02-26 | 1996-06-11 | Masayuki Kimura | Pattern recognition data processing device using an associative matching method |
US5091968A (en) * | 1990-12-28 | 1992-02-25 | Ncr Corporation | Optical character recognition system and method |
US5317654A (en) * | 1991-09-26 | 1994-05-31 | Inscerco Mfg. Inc. | Selective collating and inserting apparatus |
TW222337B (ja) * | 1992-09-02 | 1994-04-11 | Motorola Inc | |
US5337372A (en) * | 1992-10-13 | 1994-08-09 | At&T Bell Laboratories | Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions |
JP2979109B2 (ja) * | 1992-12-03 | 1999-11-15 | 日本アイ・ビー・エム 株式会社 | 認識文字の情報作成方法及び装置 |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
JPH07152865A (ja) | 1993-11-30 | 1995-06-16 | Canon Inc | 情報認識装置及びその方法 |
EP0677811A1 (en) * | 1994-04-15 | 1995-10-18 | Canon Kabushiki Kaisha | Image processing system with on-the-fly JPEG compression |
US5970170A (en) * | 1995-06-07 | 1999-10-19 | Kodak Limited | Character recognition system indentification of scanned and real time handwritten characters |
TW347503B (en) * | 1995-11-15 | 1998-12-11 | Hitachi Ltd | Character recognition translation system and voice recognition translation system |
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
JPH1132287A (ja) * | 1997-07-08 | 1999-02-02 | Fuji Photo Film Co Ltd | 画像ファイル作成方法および装置 |
US6041143A (en) * | 1998-04-14 | 2000-03-21 | Teralogic Incorporated | Multiresolution compressed image management system and method |
-
1999
- 1999-05-12 JP JP13150999A patent/JP4338155B2/ja not_active Expired - Fee Related
- 1999-06-08 EP EP99304479A patent/EP0964353B1/en not_active Expired - Lifetime
- 1999-06-08 DE DE69942165T patent/DE69942165D1/de not_active Expired - Fee Related
- 1999-06-10 US US09/329,202 patent/US6668101B2/en not_active Expired - Fee Related
- 1999-06-11 CN CNB991083679A patent/CN1149509C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20020122590A1 (en) | 2002-09-05 |
CN1149509C (zh) | 2004-05-12 |
CN1241758A (zh) | 2000-01-19 |
JP2000067155A (ja) | 2000-03-03 |
EP0964353A2 (en) | 1999-12-15 |
EP0964353B1 (en) | 2010-03-24 |
EP0964353A3 (en) | 2001-05-23 |
DE69942165D1 (de) | 2010-05-06 |
US6668101B2 (en) | 2003-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4338155B2 (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP5111268B2 (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US7805022B2 (en) | Image processing apparatus, image processing method and computer program | |
US20060008114A1 (en) | Image processing system and image processing method | |
JP4661580B2 (ja) | 画像処理装置及びプログラム | |
US8384936B2 (en) | System which performs resolution-dependent vectorization of print data | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
JP2007066188A (ja) | 画像処理装置およびその方法 | |
JP2000306103A (ja) | 情報処理装置及び方法 | |
US7126612B2 (en) | Image processing apparatus, image processing method, program, and storage medium | |
US6714682B2 (en) | Image processing device and method and memory medium | |
JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
JP2004192307A (ja) | 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
JP2007129557A (ja) | 画像処理システム | |
JP4142223B2 (ja) | 画像処理方法および画像処理装置 | |
JP2002024766A (ja) | 文字認識装置及び方法 | |
JP2006134042A (ja) | 画像処理システム | |
JP2000187670A (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP2002236921A (ja) | 文書画像認識方法、文書画像認識装置及び記録媒体 | |
JP2000306076A (ja) | 画像処理装置及び制御方法及び記憶媒体 | |
JP2000172785A (ja) | 文字認識装置及びその方法、コンピュータ可読メモリ | |
JP2730073B2 (ja) | 表題一覧作成装置 | |
JP2006146486A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060511 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060511 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080729 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090629 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130710 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |