JP4338155B2 - 画像処理装置及びその方法、コンピュータ可読メモリ - Google Patents

画像処理装置及びその方法、コンピュータ可読メモリ Download PDF

Info

Publication number
JP4338155B2
JP4338155B2 JP13150999A JP13150999A JP4338155B2 JP 4338155 B2 JP4338155 B2 JP 4338155B2 JP 13150999 A JP13150999 A JP 13150999A JP 13150999 A JP13150999 A JP 13150999A JP 4338155 B2 JP4338155 B2 JP 4338155B2
Authority
JP
Japan
Prior art keywords
resolution
image
character recognition
document
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13150999A
Other languages
English (en)
Other versions
JP2000067155A (ja
JP2000067155A5 (ja
Inventor
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP13150999A priority Critical patent/JP4338155B2/ja
Priority to DE69942165T priority patent/DE69942165D1/de
Priority to EP99304479A priority patent/EP0964353B1/en
Priority to US09/329,202 priority patent/US6668101B2/en
Priority to CNB991083679A priority patent/CN1149509C/zh
Publication of JP2000067155A publication Critical patent/JP2000067155A/ja
Publication of JP2000067155A5 publication Critical patent/JP2000067155A5/ja
Application granted granted Critical
Publication of JP4338155B2 publication Critical patent/JP4338155B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置及びその方法、コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】
従来の文字認識機能を有する画像処理装置は、基本的に単一解像度の二値画像を認識対象としていた。一方、文字認識の精度は一般的に入力画像の解像度と密接な関係にあることが判明している。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の画像処理装置は、単一解像度の画像を対象としていたため、認識精度の観点から見れば、常に最適な条件で文字認識を行える環境にあるとは言い難かった。
【0004】
本発明は上記の問題点に鑑みてなされたものであり、文字認識精度を向上することができる画像処理装置及びその方法、コンピュータ可読メモリを提供することを目的とする。
【0005】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報を保存する保存手段と
を備える。
【0006】
また、好ましくは、前記保存手段により保存された最適解像度の情報に基づいて、前記画像ファイルに含まれる前記最適解像度の原稿画像の文字認識を行う認識手段と、
前記認識手段による認識結果を出力する出力手段と
を更に備える。
【0007】
また、好ましくは、前記保存手段は、前記最適解像度の情報を前記画像ファイル内に保存する。
【0008】
また、好ましくは、入力された原稿画像を複数種類の解像度の原稿画像に変換し、当該変換された複数種類の解像度の原稿画像を含む所定のフォーマットの画像ファイルを生成する変換手段を更に備える
【0009】
また、好ましくは、前記所定のフォーマットは、FlashPixまたはCIFFである。
【0010】
また、好ましくは、前記判定手段は、前記画像ファイルに含まれる各解像度の原稿画像における所定領域に対して文字認識を実行し、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、前記最適解像度の原稿画像として判定する。
【0011】
また、好ましくは、前記所定領域は、前記原稿画像に含まれるテキストブロックのうちの最初のブロックである。
【0013】
また、好ましくは、前記判定手段は、前記画像ファイルに含まれる複数の解像度の原稿画像に対して、当該解像度が低い方から高い方、あるいは高い方から低い方のいずれかの順で、順次文字認識を実行していき、前記平均相関値がピークを示したと判断すると当該文字認識を停止し、当該ピークを示した際の解像度を前記最適解像度として判定する。
【0015】
上記の目的を達成するための本発明による画像処理方法は以下の構成を備える。即ち、
画像処理装置の判定手段が、複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定工程と、
画像処理装置の保存手段が、前記判定工程で判定された最適解像度の情報を保存する保存工程と
を備える。
【0016】
上記の目的を達成するための本発明によるコンピュータ可読記憶媒体は以下の構成を備える。即ち、
複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
前記判定手段で判定された最適解像度の情報をメモリに保存する保存手段
としてコンピュータを機能させるためのコンピュータプログラムを格納した、コンピュータ可読記憶媒体。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
[実施形態1]
図1は本発明による画像処理装置の機能的構成を示すブロック図である。
【0021】
図1において、2は原稿画像を入力するスキャナである。尚、原稿画像の入力は、スキャナ2に限定されず、デジタルカメラ、記憶装置等に記憶された画像を入力するような構成にしても良い。4はスキャナ2で入力された画像を、画像のファイルフォーマットの1つであるFlashPix(フラッシュピクス)画像に変換するFlashPix展開部である。6はFlashPix展開部4で変換されたFlashPix画像を保存する画像メモリである。
【0022】
8は画像メモリ6に保存された画像より文字認識に最適な解像度を判定する文字認識最適解像度判定回路である。10は文字認識最適解像度判定回路8の判定結果に基づいて、画像メモリ6に蓄積された画像より最終的な文字認識を行う文字認識回路である。12は文字認識回路10の認識結果を、記憶装置、プリンタ、ディスプレイ、ネットワーク等に出力する出力回路である。
【0023】
ここで、FlashPix画像のファイルフォーマットについて簡単に説明する。
【0024】
FlashPix(米国Eastman Kodak社の登録商標)ファイルフォーマットの画像ファイルでは、画像ヘッダ部に格納されている画像属性情報および画像データをさらに構造化して画像ファイル内に格納する。この構造化した画像ファイルを、図4、図5に示す。
【0025】
画像ファイル内の各プロパティや画像データには、MS−DOSのディレクトリとファイルに相当する、ストレージとストリームによって管理する。図4、図5において、陰付き部分がストレージであり、陰なし部分がストリームである。画像データや画像属性情報は、ストリームに格納される。画像データは異なる解像度で階層化されており、それぞれの解像度の画像をSubimageと呼び、その解像度Resolution0,1,…,n−1,nで示してある。各解像度の画像に対して、その画像を読み出すために必要な情報がSubimage Headerに、また、画像データがSubimage dataに格納される。
【0026】
プロパティセット(Property Set)とは、属性情報をその使用目的、内容に応じて分類して定義したものであり、Summary Info. Property Set,Image Info. Property Set,Image Content Property Set,Extension list property Setがある。
【0027】
[各プロパティセットの説明]
Summary Info. Property Setは、FlashPix特有のものではなく、例えば、Microsoft社のストラクチャードストレージでは、必須のプロパティセットであり、その画像ファイルのタイトル・題名・著者・サムネール画像等の情報を格納する。
【0028】
Image Contents Property Setは、画像データの格納方法を記述する属性である。この属性には、画像データの階層数、最大解像度の画像の幅、高さ、色の構成や、それぞれの解像度の画像についての幅、高さ、色の構成、あるいはJPEG圧縮を用いる際の量子化テーブル・ハフマンテーブルの定義を記述する。Image Contents Property Setの一例を、図8に示す。
【0029】
Image Info. Property Setは、画像を使用する際に利用できるさまざまな情報、例えば、その画像がどのようにして取り込まれ、どのように利用可能であるか等の情報を格納する。これらの情報の一例を挙げると以下のようになる。
【0030】
・デジタルデータの取り組み方法/あるいは生成方法に関する情報(File Source)
・著作権に関する情報(Intellectual property)
・画像の内容(画像中の人物、場所など)に関する情報(Content description)
・撮影に使われたカメラに関する情報(Camera information)
・撮影時のカメラのセッティング(露出、シャッタースピード、焦点距離、フラッシュ使用の有無など)の情報(Per Picture camera settings)
・デジタルカメラ特有解像度やモザイクフィルタに関する情報(Digital camera characterization)
・フィルムのメーカ名、製品名、種類(ネガ・ポジ、カラー/白黒)などの情報(Film description)
・オリジナルが書物や印刷物である場合の種類やサイズに関する情報(Original document scan description)
・スキャン画像の場合、使用したスキャナやソフト、操作した人に関する情報(Scan device)
Extension list Property Setは、FlashPixの基本仕様に含まれない情報を追加する際に使用する領域である
図5に示すFlashPix Image View Objectは、画像を表示する際に用いるビューイングパラメータと画像データをあわせて格納する画像ファイルである。ビューイングパラメータとは、画像の回転、拡大/縮小、移動、色変換、フィルタリングの処理を画像表示の際に適応するために記憶しておく処理係数のセットである。
【0031】
Source/Result FlashPix Image Objectは、FlashPix画像の実体であり、Source FlashPix Image Objectは必須、Result FlashPix Image Objectはオプションである。Source FlashPix Image Objectはオリジナルの画像を、Result FlashPix Image Objectはビューイングパラメータ使って画像処理した画像を格納する。 Source/Result desc. Property setは、上記画像データの識別のためのプロパティセットであり、画像ID、変更禁止のプロパティセット、最終更新日時等の情報を格納する。
【0032】
Transform property setは、回転、拡大/縮小、移動のためのAffine変換係数、色変換マトリクス、コントラスト調整値、フィルタリング係数等の情報を格納している。
【0033】
次に、画像データの取り扱いについて説明する。
【0034】
図6に解像度の異なる複数の画像から構成される画像ファイルの例を示す。
【0035】
図6において、最大解像度の画像は列×行がC×Rで構成されており、その次に大きい画像はC/2×R/2であり、それ以降順次、列・行ともに1/2ずつ縮小し、列・行ともに64画素以下あるいは等しくなるまで繰り返す。
【0036】
このように階層化した結果、画像の属性情報として「1つの画像ファイル中の階層数」やそれぞれの階層の画像に対して、上述ヘッダ情報と画像データが必要となる。1つの画像ファイル中の階層の数や最大解像度の画像の幅、高さ、あるいはそれぞれの解像度の画像の幅、高さ、色構成、圧縮方式等に関する情報は、上記Image Contents Property Setとして、図8に示すように記述される。
【0037】
更に、各解像度の画像は、図7に示すように64×64のタイルに分割されている。画像の左上部から順次64×64のタイルに分割をすると、画像によっては、右端および下端のタイルの一部に空白が生ずる場合がある。この場合はそれぞれ最右端画像または最下端画像を繰り返し挿入することで、64×64画素を構築する。FlashuPixでは、それぞれのタイル中の画像をJPEG圧縮、シングルカラー、非圧縮のいずれかの方法で格納する。尚、JPEG圧縮は、ISO/IEC JTC1/SC29により国際標準化された画像圧縮方式であり、方式自体の説明はここでは割愛する。また、シングルカラーとは、前記1つのタイルがすべて同じ色で構成されている場合にのみ、個々の画素の値を記録することなく、そのタイルの色を1色で表現する方式である。この方式は、特に、コンピュータグラフィックスにより生成された画像に有効である。
【0038】
このように、タイル分割された画像データはSubimage dataストリーム中に格納され、タイルの総数、個々のタイルのサイズ、データの開始位置、圧縮方法はすべてSubimage headerに格納されている。このSubimage headerの一例を、図9に示す。
【0039】
次に、上記図1の構成で実行される動作について説明する。
【0040】
スキャナ2から入力された画像は、FlashPix展開部4においてFlashPix画像に変換され、画像メモリ6に蓄積される。次に、文字認識最適解像度判定回路8において、まず、画像メモリ6より各解像度における画像の所定の部分の読取りを行い、それぞれ文字認識を行う。続いて、各文字認識結果より最適文字認識解像度を求める。
【0041】
文字認識回路10においては、文字認識最適解像度判定回路8において求められた最適解像度の画像を、改めて画像メモリ6より読み出し、その画像全体に対し文字認識を行う。文字認識最適解像度判定回路8と文字認識回路10の動作の詳細については後述する。出力回路12では、文字認識回路10による文字認識結果を出力形態(ファイル、プリンタ、ディスプレイ、ネットワーク等)に合わせて変換して出力する。
【0042】
図10は本発明に係る画像処理装置のハードウェア構成を示す図である。
【0043】
図10における各種構成について、図1の各構成との関連も含めて説明する。
101はCPU(中央処理装置)であり、メモリ(MEM)102や外部記憶媒体103に格納されているプログラムコードに従って各種処理を実行する。後述するフローチャートに示す処理も、CPU101の制御に基づいて実行される。また、FlashPix展開部4、文字認識最適解像度判定回路8、文字認識回路10も、このCPU101により実現する。
【0044】
102はROM及びRAMからなるメモリであり、画像入力装置104により入力、外部記憶媒体103から読み取り、あるいは通信I/F108により通信回線を介して他の端末から入力した画像、FlashPix等のファイルフォーマットに変換された画像データ、文字認識回路10による文字認識で用いる文字辞書データ、認識結果の候補文字群、後述する処理で用いる各種パラメータ等を記憶する。また、処理中のデータを格納するためのワーキングメモリの領域を備える。画像メモリ6は、このメモリ102により実現する。
【0045】
103はCD−ROM、CD−R、FD等の本装置に着脱可能な外部記憶媒体であって、画像や制御プログラムのプログラムコード、処理結果の画像ファイルやテキスト等を記憶あるいは読み出すことができる。104は原稿の画像を光学的に読み取るスキャナやデジタルカメラ等の画像入力装置であり、スキャナ2はこの画像入力装置104に対応する。105はCRTや液晶表示器等の表示器であって、画像、テキスト、処理途中のメッセージ等を表示する。キーボード107により入力されたデータや操作画面も表示器105により表示する。
【0046】
106はLBP(レーザビームプリンタ)やインクジェットプリンタ等のプリンタであり、画像やテキスト等を記録する。107はキーボードであり、オペレータの操作により、各種コマンドや文字コード等を入力することができる。キーボード107の代わりに、あるいは加えてマウスやタブレット等の座標データを入力できる座標入力装置を備えても良い。108は通信I/Fであり、通信回線(公衆回線あるいはLAN)を介して他の端末とデータあるいはコマンド等の送受信を行う。109はバスであり、各種構成要素間でのデータあるいはコマンド等を相互に通信可能とする。
【0047】
次に、文字認識最適解像度判定回路8と文字認識回路10で実行される処理の詳細について、それぞれ図2、図3を用いて説明する。
【0048】
図2は本発明の実施形態1の文字認識最適解像度判定回路で実行される処理の詳細を示すフローチャートである。
【0049】
ステップS202において、ステップS204で読み込むFlashPix画像の読み取り解像度を格納するメモリ102中の読み取り解像度パラメータを、処理対象となっているFlashPix画像の中の最高の解像度に設定する。次に、ステップS204で、画像メモリ6に記憶されているFlashPix画像の読み取り解像度パラメータが示す解像度の画像の所定領域を読み出す。ここで、所定領域とは、例えば、画像に含まれるテキストブロックの中の最初のブロックとする。ステップS206で、読み出した画像を二値化する。次に、ステップS208で、二値化された画像に対し、文字認識回路10による文字切り、相関演算の一連の文字認識作業を行う。ステップS210において、ステップS204で読み込んだ画像に対する文字認識の評価値である文字毎の相関値の平均相関値を求める。この平均相関値は、例えば、ステップS208で文字認識した結果として得られる第1候補文字の類似度を全て加算し、文字数で割った値とする。求めた平均相関値は画像の解像度に対応づけてメモリ102に格納する。
【0050】
ステップS212で、処理対象となっているFlashPix画像の最低解像度まですべての解像度の画像に対してステップS204〜ステップS210の平均相関値を求める処理を行ったか否かを判定する。すべての解像度の画像における平均相関値を求めていないと判定される場合(ステップS212でNO)、ステップS214へ進み、現在読み取り解像度パラメータに設定されている解像度を1ランク下げてメモリ102に設定し、ステップS204に戻る。一方、すべての解像度における平均相関値を求めていると判定された場合(ステップS212でYES)、ステップS216に進み、メモリ102に格納されているすべての解像度の画像に対する平均相関値の中から最大値を検索し、その最大値を得た画像の解像度を文字認識最適解像度とメモリ102に設定して処理を終了する。
【0051】
ここで、検索した最大値が、メモリ102に予め格納してあるしきい値を満たさない、即ち、類似度が低い場合は、ステップS204で読み出す領域を別の領域(例えば、2番目に切り出されるテキストブロック)に変えて、ステップS202〜ステップS216の処理を繰り返しても良い。また、ステップS216で求めた文字認識最適解像度のデータは、FlashPix画像の中に格納しても良い。
【0052】
図3は本発明の実施形態1の文字認識回路で実行される処理の詳細を示すフローチャートである。
【0053】
ステップS302で、文字認識最適解像度判定回路8でメモリ102に格納された文字認識最適解像度を読み取る。次に、ステップS304で、読み取られた文字認識最適解像度のFlashPix画像を画像メモリ6より読み取る。ステップS306で、画像メモリ6より読み取られた画像全体に対し、文字認識回路10により文字認識を行う。認識結果のテキストは、FlashPix画像のファイルフォーマットで格納しても良いし、表示器105、プリンタ106、通信I/F108より出力しても良い。
【0054】
以上説明したように、実施形態1によれば、文字認識最適解像度判定回路8により、文字認識に最適な解像度をあらかじめ判定することが可能となり、その判定された解像度のFlashPix画像を用いて文字認識を行うことにより、文字認識精度を飛躍的に向上させることが可能となる。
[実施形態2]
実施形態1の文字認識最適解像度判定回路6では、画像の一部の領域を抽出して文字認識最適解像度の判定を行っていたが、本発明はこれに限定されるものではない。例えば、文字認識対象の画像が複数ページからなるマルチページの画像である場合、その第1ページを抽出して、文字認識最適解像度の判定を行い、この判定された文字認識最適解像度で全ページの画像を文字認識するような構成にしても良い。
【0055】
尚、実施形態1、2においては、FlashPix画像を用いる例について説明したが、本発明はこれに限定されるものではなく、CIFF(Canon Image Format File)(キヤノン社の登録商標)等、複数の解像度の画像を記憶、あるいは生成できる他のフォーマットデータであっても良いことは勿論である。
【0056】
尚、実施形態1においては、ステップS202において読み取り解像度を最高レベルに設定し、ステップS214において順次解像度を落としながら文字認識最適解像度判定を行う例について説明したが、本発明はこれに限るものではない。例えば、ステップS202において読み取り解像度を最低レベルに設定し、ステップS214において順次解像度のレベルを一ランクずつ上げながら全ての解像度でのチェックを行い、文字認識最適解像度判定を行っても良い。
【0057】
また、実施形態1においては、ステップS216において全解像度の画像から得られた平均相関値の最大値を検索し、その最大値を得た解像度を文字認識最適解像度として決定していたが、本発明はこれに限るものではない。例えば、各解像度で得た平均相関値の履歴を監視し、ステップS210で求めた値がピークを示した時点でその値を得た画像の解像度を文字認識最適解像度として決定し、次の解像度の画像の平均相関値を演算する処理を停止しても良い。図11は、最低レベルの解像度の画像から順次平均相関値を求めた場合の平均相関値の履歴を示す図であって、1104を求めた時点で1103がピークであることが認識され、演算を停止する。
【0058】
以上説明したように、上記実施形態1、2では、同一画像で複数の解像度において文字認識精度の判定を行い、その判定結果に基づき最高精度の解像度の画像を選択して文字認識を行うことができるので、文字認識精度を飛躍的に向上させることが可能となる。
【0059】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0060】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。前述のフローチャートにより説明した各処理ステップは、このプログラムコードに従って、CPUの制御のもと実行されるものである。
【0061】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0062】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0063】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0064】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0065】
【発明の効果】
以上説明したように、本発明によれば、文字認識精度を向上することができる画像処理装置及びその方法、コンピュータ可読メモリを提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態1の画像処理装置の機能的構成を示すブロック図である。
【図2】本発明の実施形態1の文字認識最適解像度判定回路で実行される処理の詳細を示すフローチャートである。
【図3】本発明の実施形態1の文字認識回路で実行される処理の詳細を示すフローチャートである。
【図4】構造化された画像ファイルの一例を示す図である。
【図5】構造化された画像ファイルの一例を示す図である。
【図6】解像度の異なる複数の画像から構成される画像ファイルの一例を示す図である。
【図7】タイル分割の一例を示す図である。
【図8】 Image Contents Property Setの一例を示す図である。
【図9】 Subimage headerの一例を示す図である。
【図10】本発明に係る画像処理装置のハードウェア構成を示す図である。
【図11】平均相関値の履歴を示す図である。
【符号の説明】
2 スキャナ
4 FlashPix展開部
6 画像メモリ
8 文字認識最適解像度判定回路
10 文字認識回路
12 出力回路

Claims (10)

  1. 複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
    前記判定手段で判定された最適解像度の情報を保存する保存手段と
    を備えることを特徴とする画像処理装置。
  2. 前記保存手段により保存された最適解像度の情報に基づいて、前記画像ファイルに含まれる前記最適解像度の原稿画像の文字認識を行う認識手段と、
    前記認識手段による認識結果を出力する出力手段と
    を更に備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記保存手段は、前記最適解像度の情報を前記画像ファイル内に保存する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 入力された原稿画像を複数種類の解像度の原稿画像に変換し、当該変換された複数種類の解像度の原稿画像を含む所定のフォーマットの画像ファイルを生成する変換手段を更に備える
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記所定のフォーマットは、FlashPixまたはCIFFである
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 前記判定手段は、前記画像ファイルに含まれる各解像度の原稿画像における所定領域に対して文字認識を実行し、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、前記最適解像度の原稿画像として判定する
    ことを特徴とする請求項1に記載の画像処理装置。
  7. 前記所定領域は、前記原稿画像に含まれるテキストブロックのうちの最初のブロックである
    ことを特徴とする請求項6に記載の画像処理装置。
  8. 前記判定手段は、前記画像ファイルに含まれる複数の解像度の原稿画像に対して、当該解像度が低い方から高い方、あるいは高い方から低い方のいずれかの順で、順次文字認識を実行していき、前記平均相関値がピークを示したと判断すると当該文字認識を停止し、当該ピークを示した際の解像度を前記最適解像度として判定する
    ことを特徴とする請求項1に記載の画像処理装置。
  9. 画像処理装置の判定手段が、複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定工程と、
    画像処理装置の保存手段が、前記判定工程で判定された最適解像度の情報を保存する保存工程と
    を備えることを特徴とする画像処理方法。
  10. 複数種類の解像度の原稿画像を含む所定フォーマットの画像ファイルに対して当該複数種類の解像度の原稿画像ごとに文字認識を実行することにより、当該文字認識結果の平均相関値を解像度ごとに求め、前記画像ファイルに含まれる前記複数種類の解像度の原稿画像の中で当該求めた平均相関値が最大となる解像度の原稿画像を、文字認識を実行するのに最も適した最適解像度の原稿画像として判定する判定手段と、
    前記判定手段で判定された最適解像度の情報をメモリに保存する保存手段
    としてコンピュータを機能させるためのコンピュータプログラムを格納した、コンピュータ可読記憶媒体。
JP13150999A 1998-06-12 1999-05-12 画像処理装置及びその方法、コンピュータ可読メモリ Expired - Fee Related JP4338155B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP13150999A JP4338155B2 (ja) 1998-06-12 1999-05-12 画像処理装置及びその方法、コンピュータ可読メモリ
DE69942165T DE69942165D1 (de) 1998-06-12 1999-06-08 Bildverarbeitungsgerät und computerlesbarer Speicher
EP99304479A EP0964353B1 (en) 1998-06-12 1999-06-08 Image processing apparatus and method, and computer-readable memory
US09/329,202 US6668101B2 (en) 1998-06-12 1999-06-10 Image processing apparatus and method, and computer-readable memory
CNB991083679A CN1149509C (zh) 1998-06-12 1999-06-11 图像处理设备和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16530298 1998-06-12
JP10-165302 1998-06-12
JP13150999A JP4338155B2 (ja) 1998-06-12 1999-05-12 画像処理装置及びその方法、コンピュータ可読メモリ

Publications (3)

Publication Number Publication Date
JP2000067155A JP2000067155A (ja) 2000-03-03
JP2000067155A5 JP2000067155A5 (ja) 2006-07-06
JP4338155B2 true JP4338155B2 (ja) 2009-10-07

Family

ID=26466328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13150999A Expired - Fee Related JP4338155B2 (ja) 1998-06-12 1999-05-12 画像処理装置及びその方法、コンピュータ可読メモリ

Country Status (5)

Country Link
US (1) US6668101B2 (ja)
EP (1) EP0964353B1 (ja)
JP (1) JP4338155B2 (ja)
CN (1) CN1149509C (ja)
DE (1) DE69942165D1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6891972B2 (en) * 1997-12-19 2005-05-10 Canon Kabushiki Kaisha Communication system and control method thereof, and computer-readable memory
US20010019424A1 (en) * 2000-03-06 2001-09-06 Takenori Idehara Image-forming devices portable telephones, image-processing devices, image-processing methods, and computer program product
CN1305006C (zh) * 2001-07-12 2007-03-14 杜莱布斯公司 向图象处理装置提供格式化信息的方法和系统
FR2827459B1 (fr) * 2001-07-12 2004-10-29 Poseidon Procede et systeme pour fournir a des logiciels de traitement d'image des informations formatees liees aux caracteristiques des appareils de capture d'image et/ou des moyens de restitution d'image
FR2827460B1 (fr) * 2001-07-12 2004-10-29 Poseidon Procede et systeme pour fournir, selon un format standard, a des logiciels de traitement d'images des informations liees aux caracteristiques des appareils de capture d'image et/ou des moyens de resti
JP4159986B2 (ja) 2001-07-12 2008-10-01 ドゥ ラブズ デジタル画像から変換された画像を計算するための方法およびシステム
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US7343052B2 (en) * 2002-04-09 2008-03-11 Sonic Solutions End-user-navigable set of zoomed-in images derived from a high-resolution master image
US20040047519A1 (en) * 2002-09-05 2004-03-11 Axs Technologies Dynamic image repurposing apparatus and method
JP4064196B2 (ja) * 2002-10-03 2008-03-19 株式会社リコー クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法
FR2851357B1 (fr) * 2003-02-19 2005-04-22 Solystic Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images
US20040210444A1 (en) * 2003-04-17 2004-10-21 International Business Machines Corporation System and method for translating languages using portable display device
JP2005084948A (ja) * 2003-09-09 2005-03-31 Hitachi Ltd 情報処理装置、情報処理方法及び情報処理システム
FR2899359B1 (fr) * 2006-03-28 2008-09-26 Solystic Sas Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux
US8098934B2 (en) 2006-06-29 2012-01-17 Google Inc. Using extracted image text
US7953295B2 (en) * 2006-06-29 2011-05-31 Google Inc. Enhancing text in images
US8031940B2 (en) * 2006-06-29 2011-10-04 Google Inc. Recognizing text in images using ranging data
JP4986279B2 (ja) * 2006-09-08 2012-07-25 任天堂株式会社 ゲームプログラムおよびゲーム装置
US8000554B2 (en) * 2007-04-04 2011-08-16 Xerox Corporation Automatic dynamic range adjustment in digital imaging
US8611661B2 (en) * 2007-12-26 2013-12-17 Intel Corporation OCR multi-resolution method and apparatus
US7933473B2 (en) * 2008-06-24 2011-04-26 Microsoft Corporation Multiple resolution image storage
US8064733B2 (en) * 2008-06-24 2011-11-22 Microsoft Corporation Variable resolution images
US7983512B2 (en) * 2008-06-24 2011-07-19 Microsoft Corporation Embedding large images within one another
JP5683367B2 (ja) * 2011-04-20 2015-03-11 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、およびプログラム
CN103136559B (zh) * 2011-11-30 2016-01-20 北大方正集团有限公司 可变条码的光栅化方法和装置
CN102567947A (zh) * 2012-01-12 2012-07-11 惠州Tcl移动通信有限公司 一种移动终端中图像处理方法及移动终端
GB201203883D0 (en) * 2012-03-05 2012-04-18 King S College London Method and system to assist 2D-3D image registration
JP6049437B2 (ja) 2012-12-14 2016-12-21 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP6001008B2 (ja) * 2014-06-06 2016-10-05 キヤノン株式会社 画像読取装置、画像読取装置の制御方法、プログラム、及び記憶媒体
JP6705984B2 (ja) * 2015-03-31 2020-06-03 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
WO2017079696A1 (en) * 2015-11-06 2017-05-11 California Institute Of Technology Devices and methods for direct visual detection and readout of single nucleic acid molecules
JP6596512B2 (ja) 2015-12-25 2019-10-23 株式会社Pfu モバイル端末、画像処理方法、および、プログラム
JP7326779B2 (ja) * 2019-03-11 2023-08-16 富士フイルムビジネスイノベーション株式会社 画像形成装置及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5943480A (ja) * 1982-09-03 1984-03-10 Ricoh Co Ltd 文字認識方法
DE68928703T2 (de) * 1988-07-20 1998-12-10 Fujitsu Ltd Buchstabenerkennungsvorrichtung
US5361309A (en) * 1989-09-07 1994-11-01 Canon Kabushiki Kaisha Character recognition apparatus and method with low-resolution storage for character extraction
US5309548A (en) * 1989-09-21 1994-05-03 Canon Kabushiki Kaisha Pattern generating method and apparatus
CA2036974C (en) * 1990-02-26 1996-06-11 Masayuki Kimura Pattern recognition data processing device using an associative matching method
US5091968A (en) * 1990-12-28 1992-02-25 Ncr Corporation Optical character recognition system and method
US5317654A (en) * 1991-09-26 1994-05-31 Inscerco Mfg. Inc. Selective collating and inserting apparatus
TW222337B (ja) * 1992-09-02 1994-04-11 Motorola Inc
US5337372A (en) * 1992-10-13 1994-08-09 At&T Bell Laboratories Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions
JP2979109B2 (ja) * 1992-12-03 1999-11-15 日本アイ・ビー・エム 株式会社 認識文字の情報作成方法及び装置
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
JPH07152865A (ja) 1993-11-30 1995-06-16 Canon Inc 情報認識装置及びその方法
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
US5970170A (en) * 1995-06-07 1999-10-19 Kodak Limited Character recognition system indentification of scanned and real time handwritten characters
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
US5784487A (en) * 1996-05-23 1998-07-21 Xerox Corporation System for document layout analysis
JPH1132287A (ja) * 1997-07-08 1999-02-02 Fuji Photo Film Co Ltd 画像ファイル作成方法および装置
US6041143A (en) * 1998-04-14 2000-03-21 Teralogic Incorporated Multiresolution compressed image management system and method

Also Published As

Publication number Publication date
US20020122590A1 (en) 2002-09-05
CN1149509C (zh) 2004-05-12
CN1241758A (zh) 2000-01-19
JP2000067155A (ja) 2000-03-03
EP0964353A2 (en) 1999-12-15
EP0964353B1 (en) 2010-03-24
EP0964353A3 (en) 2001-05-23
DE69942165D1 (de) 2010-05-06
US6668101B2 (en) 2003-12-23

Similar Documents

Publication Publication Date Title
JP4338155B2 (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US20060008114A1 (en) Image processing system and image processing method
JP4661580B2 (ja) 画像処理装置及びプログラム
US8384936B2 (en) System which performs resolution-dependent vectorization of print data
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP2007066188A (ja) 画像処理装置およびその方法
JP2000306103A (ja) 情報処理装置及び方法
US7126612B2 (en) Image processing apparatus, image processing method, program, and storage medium
US6714682B2 (en) Image processing device and method and memory medium
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2004192307A (ja) 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP2007129557A (ja) 画像処理システム
JP4142223B2 (ja) 画像処理方法および画像処理装置
JP2002024766A (ja) 文字認識装置及び方法
JP2006134042A (ja) 画像処理システム
JP2000187670A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
JP2000306076A (ja) 画像処理装置及び制御方法及び記憶媒体
JP2000172785A (ja) 文字認識装置及びその方法、コンピュータ可読メモリ
JP2730073B2 (ja) 表題一覧作成装置
JP2006146486A (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060511

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060511

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080729

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090626

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090629

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130710

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees