JP2000067155A - 画像処理装置及びその方法、コンピュ―タ可読メモリ - Google Patents
画像処理装置及びその方法、コンピュ―タ可読メモリInfo
- Publication number
- JP2000067155A JP2000067155A JP11131509A JP13150999A JP2000067155A JP 2000067155 A JP2000067155 A JP 2000067155A JP 11131509 A JP11131509 A JP 11131509A JP 13150999 A JP13150999 A JP 13150999A JP 2000067155 A JP2000067155 A JP 2000067155A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character recognition
- resolution
- image processing
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
理装置及びその方法、コンピュータ可読メモリを提供す
る。 【解決手段】 入力された画像を所定のフォーマットの
画像に変換する。変換された画像を用いて、入力された
画像の文字認識を実行する場合の最適解像度を文字認識
最適解像度判定部8で判定する。判定結果に基づいて、
入力された画像の文字認識を文字認識回路10で行う。
認識結果を出力回路12で出力する。
Description
その方法、コンピュータ可読メモリに関するものであ
る。
置は、基本的に単一解像度の二値画像を認識対象として
いた。一方、文字認識の精度は一般的に入力画像の解像
度と密接な関係にあることが判明している。
来の画像処理装置は、単一解像度の画像を対象としてい
たため、認識精度の観点から見れば、常に最適な条件で
文字認識を行える環境にあるとは言い難かった。
のであり、文字認識精度を向上することができる画像処
理装置及びその方法、コンピュータ可読メモリを提供す
ることを目的とする。
めの本発明による画像処理装置は以下の構成を備える。
即ち、入力された画像を所定のフォーマットの画像に変
換する変換手段と、前記変換手段で変換された画像を用
いて、前記入力された画像の文字認識を実行する場合の
最適解像度を判定する判定手段と、前記判定手段の判定
結果に基づいて、前記入力された画像の文字認識を行う
認識手段と、前記認識手段による認識結果を出力する出
力手段とを備える。
入力された画像を複数種類の解像度の画像に変換する。
トは、FlashPixである。
トは、CIFFである。
る解像度毎に前記変換された画像の文字認識を実行し、
各文字認識結果に基づいて、前記入力された画像の文字
認識を行う際の最適解像度を決定する。
各文字認識結果から得られる認識文字毎の平均相関値に
基づいて、前記入力された画像の文字認識を行う際の最
適解像度を決定する。
判定手段で判定された最適解像度における画像に対し文
字認識を行う。
高い解像度の画像へと順次文字認識を実行し、各文字認
識結果に基づいて、前記入力された画像の文字認識を行
う際の解像度を決定する。
低い解像度の画像へと順次文字認識を実行し、各文字認
識結果に基づいて、前記入力された画像の文字認識を行
う際の解像度を決定する。
各文字認識結果から得られる認識文字毎の平均相関値が
ピークを示したことの判断により、前記判定を停止す
る。
画像処理方法は以下の構成を備える。即ち、入力された
画像を所定のフォーマットの画像に変換する変換工程
と、前記変換工程で変換された画像を用いて、前記入力
された画像の文字認識を実行する場合の最適解像度を判
定する判定工程と、前記判定工程の判定結果に基づい
て、前記入力された画像の文字認識を行う認識工程と、
前記認識工程による認識結果を出力する出力工程とを備
える。
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された画像を所定のフォーマットの画像に変換する
変換工程のプログラムコードと、前記変換工程で変換さ
れた画像を用いて、前記入力された画像の文字認識を実
行する場合の最適解像度を判定する判定工程のプログラ
ムコードと、前記判定工程の判定結果に基づいて、前記
入力された画像の文字認識を行う認識工程のプログラム
コードと、前記認識工程による認識結果を出力する出力
工程のプログラムコードとを備える。
画像処理装置は以下の構成を備える。即ち、一つの画像
から生成され、解像度の異なる複数の画像を含むファイ
ルデータを入力する入力手段と、前記入力手段により入
力した複数の画像を用いて、文字認識を実行する場合の
解像度を判定する判定手段と、前記判定手段による判定
結果の解像度を前記ファイルデータに格納するよう制御
する制御手段とを有する。
画像処理方法は以下の構成を備える。即ち、一つの画像
から生成され、解像度の異なる複数の画像を含むファイ
ルデータを入力し、前記入力した複数の画像を用いて、
文字認識を実行する場合の解像度を判定し、前記判定結
果の解像度を前記ファイルデータに格納するよう制御す
る。
コンピュータ可読メモリは以下の構成を備える。即ち、
一つの画像から生成され、解像度の異なる複数の画像を
含むファイルデータを入力する入力工程のプログラムコ
ードと、前記入力工程で入力した複数の画像を用いて、
文字認識を実行する場合の解像度を判定する判定工程の
プログラムコードと、前記判定工程での判定結果の解像
度を前記ファイルデータに格納する格納工程のプログラ
ムコードとを備える。
適な実施形態を詳細に説明する。 [実施形態1]図1は本発明による画像処理装置の機能
的構成を示すブロック図である。
キャナである。尚、原稿画像の入力は、スキャナ2に限
定されず、デジタルカメラ、記憶装置等に記憶された画
像を入力するような構成にしても良い。4はスキャナ2
で入力された画像を、画像のファイルフォーマットの1
つであるFlashPix(フラッシュピクス)画像に変換する
FlashPix展開部である。6はFlashPix展開部4で変換さ
れたFlashPix画像を保存する画像メモリである。
字認識に最適な解像度を判定する文字認識最適解像度判
定回路である。10は文字認識最適解像度判定回路8の
判定結果に基づいて、画像メモリ6に蓄積された画像よ
り最終的な文字認識を行う文字認識回路である。12は
文字認識回路10の認識結果を、記憶装置、プリンタ、
ディスプレイ、ネットワーク等に出力する出力回路であ
る。
ットについて簡単に説明する。
標)ファイルフォーマットの画像ファイルでは、画像ヘ
ッダ部に格納されている画像属性情報および画像データ
をさらに構造化して画像ファイル内に格納する。この構
造化した画像ファイルを、図4、図5に示す。
タには、MS−DOSのディレクトリとファイルに相当
する、ストレージとストリームによって管理する。図
4、図5において、陰付き部分がストレージであり、陰
なし部分がストリームである。画像データや画像属性情
報は、ストリームに格納される。画像データは異なる解
像度で階層化されており、それぞれの解像度の画像をSu
bimageと呼び、その解像度Resolution0,1,…,n−
1,nで示してある。各解像度の画像に対して、その画
像を読み出すために必要な情報がSubimage Headerに、
また、画像データがSubimage dataに格納される。
属性情報をその使用目的、内容に応じて分類して定義し
たものであり、Summary Info. Property Set,Image In
fo.Property Set,Image Content Property Set,Exten
sion list property Setがある。
fo. Property Setは、FlashPix特有のものではなく、例
えば、Microsoft社のストラクチャードストレージで
は、必須のプロパティセットであり、その画像ファイル
のタイトル・題名・著者・サムネール画像等の情報を格
納する。
ータの格納方法を記述する属性である。この属性には、
画像データの階層数、最大解像度の画像の幅、高さ、色
の構成や、それぞれの解像度の画像についての幅、高
さ、色の構成、あるいはJPEG圧縮を用いる際の量子
化テーブル・ハフマンテーブルの定義を記述する。Imag
e Contents Property Setの一例を、図8に示す。
する際に利用できるさまざまな情報、例えば、その画像
がどのようにして取り込まれ、どのように利用可能であ
るか等の情報を格納する。これらの情報の一例を挙げる
と以下のようになる。
は生成方法に関する情報(File Source) ・著作権に関する情報(Intellectual property) ・画像の内容(画像中の人物、場所など)に関する情報
(Content description) ・撮影に使われたカメラに関する情報(Camera informa
tion) ・撮影時のカメラのセッティング(露出、シャッタース
ピード、焦点距離、フラッシュ使用の有無など)の情報
(Per Picture camera settings) ・デジタルカメラ特有解像度やモザイクフィルタに関す
る情報(Digital camera characterization) ・フィルムのメーカ名、製品名、種類(ネガ・ポジ、カ
ラー/白黒)などの情報(Film description) ・オリジナルが書物や印刷物である場合の種類やサイズ
に関する情報(Original document scan description) ・スキャン画像の場合、使用したスキャナやソフト、操
作した人に関する情報(Scan device) Extension list Property Setは、FlashPixの基本仕様
に含まれない情報を追加する際に使用する領域である図
5に示すFlashPix Image View Objectは、画像を表示す
る際に用いるビューイングパラメータと画像データをあ
わせて格納する画像ファイルである。ビューイングパラ
メータとは、画像の回転、拡大/縮小、移動、色変換、
フィルタリングの処理を画像表示の際に適応するために
記憶しておく処理係数のセットである。
は、FlashPix画像の実体であり、Source FlashPix Imag
e Objectは必須、Result FlashPix Image Objectはオプ
ションである。Source FlashPix Image Objectはオリジ
ナルの画像を、Result FlashPix Image Objectはビュー
イングパラメータ使って画像処理した画像を格納する。
Source/Result desc. Property setは、上記画像データ
の識別のためのプロパティセットであり、画像ID、変
更禁止のプロパティセット、最終更新日時等の情報を格
納する。
縮小、移動のためのAffine変換係数、色変換マトリク
ス、コントラスト調整値、フィルタリング係数等の情報
を格納している。
する。
される画像ファイルの例を示す。
がC×Rで構成されており、その次に大きい画像はC/
2×R/2であり、それ以降順次、列・行ともに1/2
ずつ縮小し、列・行ともに64画素以下あるいは等しく
なるまで繰り返す。
報として「1つの画像ファイル中の階層数」やそれぞれ
の階層の画像に対して、上述ヘッダ情報と画像データが
必要となる。1つの画像ファイル中の階層の数や最大解
像度の画像の幅、高さ、あるいはそれぞれの解像度の画
像の幅、高さ、色構成、圧縮方式等に関する情報は、上
記Image Contents Property Setとして、図8に示すよ
うに記述される。
に64×64のタイルに分割されている。画像の左上部
から順次64×64のタイルに分割をすると、画像によ
っては、右端および下端のタイルの一部に空白が生ずる
場合がある。この場合はそれぞれ最右端画像または最下
端画像を繰り返し挿入することで、64×64画素を構
築する。FlashuPixでは、それぞれのタイル中の画像を
JPEG圧縮、シングルカラー、非圧縮のいずれかの方
法で格納する。尚、JPEG圧縮は、ISO/IEC
JTC1/SC29により国際標準化された画像圧縮方
式であり、方式自体の説明はここでは割愛する。また、
シングルカラーとは、前記1つのタイルがすべて同じ色
で構成されている場合にのみ、個々の画素の値を記録す
ることなく、そのタイルの色を1色で表現する方式であ
る。この方式は、特に、コンピュータグラフィックスに
より生成された画像に有効である。
はSubimage dataストリーム中に格納され、タイルの総
数、個々のタイルのサイズ、データの開始位置、圧縮方
法はすべてSubimage headerに格納されている。このSub
image headerの一例を、図9に示す。
ついて説明する。
ix展開部4においてFlashPix画像に変換され、画像メモ
リ6に蓄積される。次に、文字認識最適解像度判定回路
8において、まず、画像メモリ6より各解像度における
画像の所定の部分の読取りを行い、それぞれ文字認識を
行う。続いて、各文字認識結果より最適文字認識解像度
を求める。
適解像度判定回路8において求められた最適解像度の画
像を、改めて画像メモリ6より読み出し、その画像全体
に対し文字認識を行う。文字認識最適解像度判定回路8
と文字認識回路10の動作の詳細については後述する。
出力回路12では、文字認識回路10による文字認識結
果を出力形態(ファイル、プリンタ、ディスプレイ、ネ
ットワーク等)に合わせて変換して出力する。
ドウェア構成を示す図である。
各構成との関連も含めて説明する。101はCPU(中
央処理装置)であり、メモリ(MEM)102や外部記
憶媒体103に格納されているプログラムコードに従っ
て各種処理を実行する。後述するフローチャートに示す
処理も、CPU101の制御に基づいて実行される。ま
た、FlashPix展開部4、文字認識最適解像度判定回路
8、文字認識回路10も、このCPU101により実現
する。
であり、画像入力装置104により入力、外部記憶媒体
103から読み取り、あるいは通信I/F108により
通信回線を介して他の端末から入力した画像、FlashPix
等のファイルフォーマットに変換された画像データ、文
字認識回路10による文字認識で用いる文字辞書デー
タ、認識結果の候補文字群、後述する処理で用いる各種
パラメータ等を記憶する。また、処理中のデータを格納
するためのワーキングメモリの領域を備える。画像メモ
リ6は、このメモリ102により実現する。
の本装置に着脱可能な外部記憶媒体であって、画像や制
御プログラムのプログラムコード、処理結果の画像ファ
イルやテキスト等を記憶あるいは読み出すことができ
る。104は原稿の画像を光学的に読み取るスキャナや
デジタルカメラ等の画像入力装置であり、スキャナ2は
この画像入力装置104に対応する。105はCRTや
液晶表示器等の表示器であって、画像、テキスト、処理
途中のメッセージ等を表示する。キーボード107によ
り入力されたデータや操作画面も表示器105により表
示する。
やインクジェットプリンタ等のプリンタであり、画像や
テキスト等を記録する。107はキーボードであり、オ
ペレータの操作により、各種コマンドや文字コード等を
入力することができる。キーボード107の代わりに、
あるいは加えてマウスやタブレット等の座標データを入
力できる座標入力装置を備えても良い。108は通信I
/Fであり、通信回線(公衆回線あるいはLAN)を介
して他の端末とデータあるいはコマンド等の送受信を行
う。109はバスであり、各種構成要素間でのデータあ
るいはコマンド等を相互に通信可能とする。
字認識回路10で実行される処理の詳細について、それ
ぞれ図2、図3を用いて説明する。
解像度判定回路で実行される処理の詳細を示すフローチ
ャートである。
04で読み込むFlashPix画像の読み取り解像度を格納す
るメモリ102中の読み取り解像度パラメータを、処理
対象となっているFlashPix画像の中の最高の解像度に設
定する。次に、ステップS204で、画像メモリ6に記
憶されているFlashPix画像の読み取り解像度パラメータ
が示す解像度の画像の所定領域を読み出す。ここで、所
定領域とは、例えば、画像に含まれるテキストブロック
の中の最初のブロックとする。ステップS206で、読
み出した画像を二値化する。次に、ステップS208
で、二値化された画像に対し、文字認識回路10による
文字切り、相関演算の一連の文字認識作業を行う。ステ
ップS210において、ステップS204で読み込んだ
画像に対する文字認識の評価値である文字毎の相関値の
平均相関値を求める。この平均相関値は、例えば、ステ
ップS208で文字認識した結果として得られる第1候
補文字の類似度を全て加算し、文字数で割った値とす
る。求めた平均相関値は画像の解像度に対応づけてメモ
リ102に格納する。
るFlashPix画像の最低解像度まですべての解像度の画像
に対してステップS204〜ステップS210の平均相
関値を求める処理を行ったか否かを判定する。すべての
解像度の画像における平均相関値を求めていないと判定
される場合(ステップS212でNO)、ステップS2
14へ進み、現在読み取り解像度パラメータに設定され
ている解像度を1ランク下げてメモリ102に設定し、
ステップS204に戻る。一方、すべての解像度におけ
る平均相関値を求めていると判定された場合(ステップ
S212でYES)、ステップS216に進み、メモリ
102に格納されているすべての解像度の画像に対する
平均相関値の中から最大値を検索し、その最大値を得た
画像の解像度を文字認識最適解像度とメモリ102に設
定して処理を終了する。
に予め格納してあるしきい値を満たさない、即ち、類似
度が低い場合は、ステップS204で読み出す領域を別
の領域(例えば、2番目に切り出されるテキストブロッ
ク)に変えて、ステップS202〜ステップS216の
処理を繰り返しても良い。また、ステップS216で求
めた文字認識最適解像度のデータは、FlashPix画像の中
に格納しても良い。
で実行される処理の詳細を示すフローチャートである。
判定回路8でメモリ102に格納された文字認識最適解
像度を読み取る。次に、ステップS304で、読み取ら
れた文字認識最適解像度のFlashPix画像を画像メモリ6
より読み取る。ステップS306で、画像メモリ6より
読み取られた画像全体に対し、文字認識回路10により
文字認識を行う。認識結果のテキストは、FlashPix画像
のファイルフォーマットで格納しても良いし、表示器1
05、プリンタ106、通信I/F108より出力して
も良い。
ば、文字認識最適解像度判定回路8により、文字認識に
最適な解像度をあらかじめ判定することが可能となり、
その判定された解像度のFlashPix画像を用いて文字認識
を行うことにより、文字認識精度を飛躍的に向上させる
ことが可能となる。 [実施形態2]実施形態1の文字認識最適解像度判定回
路6では、画像の一部の領域を抽出して文字認識最適解
像度の判定を行っていたが、本発明はこれに限定される
ものではない。例えば、文字認識対象の画像が複数ペー
ジからなるマルチページの画像である場合、その第1ペ
ージを抽出して、文字認識最適解像度の判定を行い、こ
の判定された文字認識最適解像度で全ページの画像を文
字認識するような構成にしても良い。
画像を用いる例について説明したが、本発明はこれに限
定されるものではなく、CIFF(Canon Image Format
File)(キヤノン社の登録商標)等、複数の解像度の
画像を記憶、あるいは生成できる他のフォーマットデー
タであっても良いことは勿論である。
02において読み取り解像度を最高レベルに設定し、ス
テップS214において順次解像度を落としながら文字
認識最適解像度判定を行う例について説明したが、本発
明はこれに限るものではない。例えば、ステップS20
2において読み取り解像度を最低レベルに設定し、ステ
ップS214において順次解像度のレベルを一ランクず
つ上げながら全ての解像度でのチェックを行い、文字認
識最適解像度判定を行っても良い。
216において全解像度の画像から得られた平均相関値
の最大値を検索し、その最大値を得た解像度を文字認識
最適解像度として決定していたが、本発明はこれに限る
ものではない。例えば、各解像度で得た平均相関値の履
歴を監視し、ステップS210で求めた値がピークを示
した時点でその値を得た画像の解像度を文字認識最適解
像度として決定し、次の解像度の画像の平均相関値を演
算する処理を停止しても良い。図11は、最低レベルの
解像度の画像から順次平均相関値を求めた場合の平均相
関値の履歴を示す図であって、1104を求めた時点で
1103がピークであることが認識され、演算を停止す
る。
では、同一画像で複数の解像度において文字認識精度の
判定を行い、その判定結果に基づき最高精度の解像度の
画像を選択して文字認識を行うことができるので、文字
認識精度を飛躍的に向上させることが可能となる。
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置な
ど)に適用してもよい。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。前述のフローチャートにより説明した各処
理ステップは、このプログラムコードに従って、CPU
の制御のもと実行されるものである。
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
文字認識精度を向上することができる画像処理装置及び
その方法、コンピュータ可読メモリを提供できる。
成を示すブロック図である。
回路で実行される処理の詳細を示すフローチャートであ
る。
る処理の詳細を示すフローチャートである。
る。
る。
ファイルの一例を示す図である。
である。
成を示す図である。
Claims (40)
- 【請求項1】 入力された画像を所定のフォーマットの
画像に変換する変換手段と、 前記変換手段で変換された画像を用いて、前記入力され
た画像の文字認識を実行する場合の解像度を判定する判
定手段と、 前記判定手段の判定結果に基づいて、前記入力された画
像の文字認識を行う認識手段と、 前記認識手段による認識結果を出力する出力手段とを備
えることを特徴とする画像処理装置。 - 【請求項2】 前記変換手段は、前記入力された画像を
複数種類の解像度の画像に変換することを特徴とする請
求項1に記載の画像処理装置。 - 【請求項3】 前記所定のフォーマットは、FlashPixで
あることを特徴とする請求項1に記載の画像処理装置。 - 【請求項4】 前記所定のフォーマットは、CIFFで
あることを特徴とする請求項1に記載の画像処理装置。 - 【請求項5】 前記判定手段は、異なる解像度毎に前記
変換された画像の文字認識を実行し、各文字認識結果に
基づいて、前記入力された画像の文字認識を行う際の解
像度を決定することを特徴とする請求項1に記載の画像
処理装置。 - 【請求項6】 前記判定手段は、前記各文字認識結果か
ら得られる認識文字毎の平均相関値に基づいて、前記入
力された画像の文字認識を行う際の解像度を決定するこ
とを特徴とする請求項1に記載の画像処理装置。 - 【請求項7】 前記認識手段は、前記判定手段で判定さ
れた解像度における画像に対し文字認識を行うことを特
徴とする請求項1に記載の画像処理装置。 - 【請求項8】 前記判定手段は、より高い解像度の画像
へと順次文字認識を実行し、各文字認識結果に基づい
て、前記入力された画像の文字認識を行う際の解像度を
決定することを特徴とする請求項1に記載の画像処理装
置。 - 【請求項9】 前記判定手段は、より低い解像度の画像
へと順次文字認識を実行し、各文字認識結果に基づい
て、前記入力された画像の文字認識を行う際の解像度を
決定することを特徴とする請求項1に記載の画像処理装
置。 - 【請求項10】 前記判定手段は、前記各文字認識結果
から得られる認識文字毎の平均相関値がピークを示した
ことの判断により、前記判定を停止することを特徴とす
る請求項1に記載の画像処理装置。 - 【請求項11】 入力された画像を所定のフォーマット
の画像に変換する変換工程と、 前記変換工程で変換された画像を用いて、前記入力され
た画像の文字認識を実行する場合の解像度を判定する判
定工程と、 前記判定工程の判定結果に基づいて、前記入力された画
像の文字認識を行う認識工程と、 前記認識工程による認識結果を出力する出力工程とを備
えることを特徴とする画像処理方法。 - 【請求項12】 前記変換工程は、前記入力された画像
を複数種類の解像度の画像に変換することを特徴とする
請求項11に記載の画像処理方法。 - 【請求項13】 前記所定のフォーマットは、FlashPix
であることを特徴とする請求項11に記載の画像処理方
法。 - 【請求項14】 前記所定のフォーマットは、CIFF
であることを特徴とする請求項11に記載の画像処理方
法。 - 【請求項15】 前記判定工程は、異なる解像度毎に前
記変換された画像の文字認識を実行し、各文字認識結果
に基づいて、前記入力された画像の文字認識を行う際の
解像度を決定することを特徴とする請求項11に記載の
画像処理方法。 - 【請求項16】 前記判定工程は、前記各文字認識結果
から得られる認識文字毎の平均相関値に基づいて、前記
入力された画像の文字認識を行う際の解像度を決定する
ことを特徴とする請求項11に記載の画像処理方法。 - 【請求項17】 前記認識工程は、前記判定手段で判定
された解像度における画像に対し文字認識を行うことを
特徴とする請求項11に記載の画像処理方法。 - 【請求項18】 前記判定工程は、より高い解像度の画
像へと順次文字認識を実行し、各文字認識結果に基づい
て、前記入力された画像の文字認識を行う際の解像度を
決定することを特徴とする請求項11に記載の画像処理
方法。 - 【請求項19】 前記判定工程は、より低い解像度の画
像へと順次文字認識を実行し、各文字認識結果に基づい
て、前記入力された画像の文字認識を行う際の解像度を
決定することを特徴とする請求項11に記載の画像処理
方法。 - 【請求項20】 前記判定工程は、前記各文字認識結果
から得られる認識文字毎の平均相関値がピークを示した
ことの判断により、前記判定を停止することを特徴とす
る請求項11に記載の画像処理方法。 - 【請求項21】 入力された画像を所定のフォーマット
の画像に変換する変換工程のプログラムコードと、 前記変換工程で変換された画像を用いて、前記入力され
た画像の文字認識を実行する場合の解像度を判定する判
定工程のプログラムコードと、 前記判定工程の判定結果に基づいて、前記入力された画
像の文字認識を行う認識工程のプログラムコードと、 前記認識工程による認識結果を出力する出力工程のプロ
グラムコードとを備えることを特徴とするコンピュータ
可読メモリ。 - 【請求項22】 一つの画像から生成され、解像度の異
なる複数の画像を含むファイルデータを入力する入力手
段と、 前記入力手段により入力した複数の画像を用いて、文字
認識を実行する場合の解像度を判定する判定手段と、 前記判定手段による判定結果の解像度を前記ファイルデ
ータに格納するよう制御する制御手段とを有することを
特徴とする画像処理装置。 - 【請求項23】 前記判定手段は、画像の中の一部領域
画像を文字認識することにより前記文字認識を実行する
場合の解像度を判定することを特徴とする請求項22に
記載の画像処理装置。 - 【請求項24】 前記判定手段は、画像の中の一テキス
トブロックの画像を文字認識することにより前記文字認
識を実行する場合の解像度を判定することを特徴とする
請求項22に記載の画像処理装置。 - 【請求項25】 前記判定手段は、前記入力手段により
入力したファイルデータに含まれる画像の中から文字認
識を実行する場合の画像を特定することを特徴とする請
求項22に記載の画像処理装置。 - 【請求項26】 前記判定手段は、画像毎に一部領域の
文字認識を実行し、該文字認識結果に基づいて、前記文
字認識を行う際の解像度を判定することを特徴とする請
求項22に記載の画像処理装置。 - 【請求項27】 前記判定手段による文字認識の結果が
所定の値を満たさない場合は、前記文字認識を実行した
画像とは異なる領域の文字認識を実行し、前記解像度を
判定することを特徴とする請求項26に記載の画像処理
装置。 - 【請求項28】 前記判定手段により判定された解像度
の画像を前記ファイルデータより読み出す画像読み出し
手段と、 前記画像読み出し手段により読み出した画像の文字認識
を行う文字認識手段と、 前記文字認識手段により文字認識した結果を表示する表
示手段を有することを特徴とする請求項22に記載の画
像処理装置。 - 【請求項29】 前記判定手段により判定された解像度
の画像を前記ファイルデータより読み出す画像読み出し
手段と、 前記画像読み出し手段により読み出した画像の文字認識
を行う文字認識手段と、 前記文字認識手段により文字認識した結果を記録するイ
ンクジェットプリンタとを更に有することを特徴とする
請求項22に記載の画像処理装置。 - 【請求項30】 前記判定手段により判定された解像度
の画像を前記ファイルデータより読み出す画像読み出し
手段と、 前記画像読み出し手段により読み出した画像の文字認識
を行う文字認識手段と、 前記文字認識手段により文字認識した結果を記録する記
録手段とを更に有することを特徴とする請求項22に記
載の画像処理装置。 - 【請求項31】 一つの画像から生成され、解像度の異
なる複数の画像を含むファイルデータを入力し、 前記入力した複数の画像を用いて、文字認識を実行する
場合の解像度を判定し、前記判定結果の解像度を前記フ
ァイルデータに格納するよう制御することを特徴とする
画像処理方法。 - 【請求項32】 画像の中の一部領域画像を文字認識す
ることにより前記文字認識を実行する場合の解像度を判
定することを特徴とする請求項31に記載の画像処理方
法。 - 【請求項33】 画像の中の一テキストブロックの画像
を文字認識することにより前記文字認識を実行する場合
の解像度を判定することを特徴とする請求項31に記載
の画像処理方法。 - 【請求項34】 前記入力したファイルデータに含まれ
る画像の中から文字認識を実行する場合の画像を特定す
ることを特徴とする請求項31に記載の画像処理方法。 - 【請求項35】 画像毎に一部領域の文字認識を実行
し、該文字認識結果に基づいて、前記文字認識を行う際
の解像度を判定することを特徴とする請求項31に記載
の画像処理方法。 - 【請求項36】 前記文字認識結果が所定の値を満たさ
ない場合は、前記文字認識を実行した画像とは異なる領
域の文字認識を実行し、前記解像度を判定することを特
徴とする請求項35に記載の画像処理方法。 - 【請求項37】 前記判定された解像度の画像を前記フ
ァイルデータより読み出し、前記読み出した画像を文字
認識し、 前記文字認識した結果を表示することを特徴とする請求
項31に記載の画像処理方法。 - 【請求項38】 前記判定された解像度の画像を前記フ
ァイルデータより読み出し、前記読み出した画像を文字
認識し、 前記文字認識した結果をインクジェットプリンタにより
記録することを特徴とする請求項31に記載の画像処理
方法。 - 【請求項39】 前記判定された解像度の画像を前記フ
ァイルデータより読み出し、前記読み出した画像を文字
認識し、 前記文字認識した結果を記録することを特徴とする請求
項31に記載の画像処理方法。 - 【請求項40】 一つの画像から生成され、解像度の異
なる複数の画像を含むファイルデータを入力する入力工
程のプログラムコードと、 前記入力工程で入力した複数の画像を用いて、文字認識
を実行する場合の解像度を判定する判定工程のプログラ
ムコードと、 前記判定工程での判定結果の解像度を前記ファイルデー
タに格納する格納工程のプログラムコードとを備えるこ
とを特徴とするコンピュータ可読メモリ。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13150999A JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
DE69942165T DE69942165D1 (de) | 1998-06-12 | 1999-06-08 | Bildverarbeitungsgerät und computerlesbarer Speicher |
EP99304479A EP0964353B1 (en) | 1998-06-12 | 1999-06-08 | Image processing apparatus and method, and computer-readable memory |
US09/329,202 US6668101B2 (en) | 1998-06-12 | 1999-06-10 | Image processing apparatus and method, and computer-readable memory |
CNB991083679A CN1149509C (zh) | 1998-06-12 | 1999-06-11 | 图像处理设备和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10-165302 | 1998-06-12 | ||
JP16530298 | 1998-06-12 | ||
JP13150999A JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000067155A true JP2000067155A (ja) | 2000-03-03 |
JP2000067155A5 JP2000067155A5 (ja) | 2006-07-06 |
JP4338155B2 JP4338155B2 (ja) | 2009-10-07 |
Family
ID=26466328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13150999A Expired - Fee Related JP4338155B2 (ja) | 1998-06-12 | 1999-05-12 | 画像処理装置及びその方法、コンピュータ可読メモリ |
Country Status (5)
Country | Link |
---|---|
US (1) | US6668101B2 (ja) |
EP (1) | EP0964353B1 (ja) |
JP (1) | JP4338155B2 (ja) |
CN (1) | CN1149509C (ja) |
DE (1) | DE69942165D1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100350421C (zh) * | 2003-02-19 | 2007-11-21 | 索利斯蒂克有限公司 | 一种通过多个图象光识别邮件的方法 |
US7724977B2 (en) | 2001-07-12 | 2010-05-25 | Do Labs | Method and system for providing formatted data to image processing means in accordance with a standard format |
JP2016192070A (ja) * | 2015-03-31 | 2016-11-10 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
JPWO2017109998A1 (ja) * | 2015-12-25 | 2018-05-24 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
JP2020149159A (ja) * | 2019-03-11 | 2020-09-17 | 富士ゼロックス株式会社 | 画像形成装置、情報処理装置及びプログラム |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891972B2 (en) * | 1997-12-19 | 2005-05-10 | Canon Kabushiki Kaisha | Communication system and control method thereof, and computer-readable memory |
US20010019424A1 (en) * | 2000-03-06 | 2001-09-06 | Takenori Idehara | Image-forming devices portable telephones, image-processing devices, image-processing methods, and computer program product |
EP1412918B1 (fr) | 2001-07-12 | 2007-02-21 | DO Labs | Procede et systeme pour produire des informations formatees liees aux distorsions geometriques |
FR2827459B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir a des logiciels de traitement d'image des informations formatees liees aux caracteristiques des appareils de capture d'image et/ou des moyens de restitution d'image |
FR2827460B1 (fr) * | 2001-07-12 | 2004-10-29 | Poseidon | Procede et systeme pour fournir, selon un format standard, a des logiciels de traitement d'images des informations liees aux caracteristiques des appareils de capture d'image et/ou des moyens de resti |
US6922487B2 (en) * | 2001-11-02 | 2005-07-26 | Xerox Corporation | Method and apparatus for capturing text images |
US7343052B2 (en) * | 2002-04-09 | 2008-03-11 | Sonic Solutions | End-user-navigable set of zoomed-in images derived from a high-resolution master image |
US20040047519A1 (en) * | 2002-09-05 | 2004-03-11 | Axs Technologies | Dynamic image repurposing apparatus and method |
JP4064196B2 (ja) * | 2002-10-03 | 2008-03-19 | 株式会社リコー | クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法 |
US20040210444A1 (en) * | 2003-04-17 | 2004-10-21 | International Business Machines Corporation | System and method for translating languages using portable display device |
JP2005084948A (ja) * | 2003-09-09 | 2005-03-31 | Hitachi Ltd | 情報処理装置、情報処理方法及び情報処理システム |
FR2899359B1 (fr) * | 2006-03-28 | 2008-09-26 | Solystic Sas | Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux |
US8031940B2 (en) * | 2006-06-29 | 2011-10-04 | Google Inc. | Recognizing text in images using ranging data |
US7953295B2 (en) * | 2006-06-29 | 2011-05-31 | Google Inc. | Enhancing text in images |
US8098934B2 (en) | 2006-06-29 | 2012-01-17 | Google Inc. | Using extracted image text |
JP4986279B2 (ja) * | 2006-09-08 | 2012-07-25 | 任天堂株式会社 | ゲームプログラムおよびゲーム装置 |
US8000554B2 (en) * | 2007-04-04 | 2011-08-16 | Xerox Corporation | Automatic dynamic range adjustment in digital imaging |
US8611661B2 (en) * | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
US7983512B2 (en) * | 2008-06-24 | 2011-07-19 | Microsoft Corporation | Embedding large images within one another |
US8064733B2 (en) * | 2008-06-24 | 2011-11-22 | Microsoft Corporation | Variable resolution images |
US7933473B2 (en) * | 2008-06-24 | 2011-04-26 | Microsoft Corporation | Multiple resolution image storage |
JP5683367B2 (ja) | 2011-04-20 | 2015-03-11 | キヤノン株式会社 | 画像処理装置、画像処理装置の制御方法、およびプログラム |
CN103136559B (zh) * | 2011-11-30 | 2016-01-20 | 北大方正集团有限公司 | 可变条码的光栅化方法和装置 |
CN102567947A (zh) * | 2012-01-12 | 2012-07-11 | 惠州Tcl移动通信有限公司 | 一种移动终端中图像处理方法及移动终端 |
GB201203883D0 (en) * | 2012-03-05 | 2012-04-18 | King S College London | Method and system to assist 2D-3D image registration |
JP6049437B2 (ja) | 2012-12-14 | 2016-12-21 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP6001008B2 (ja) * | 2014-06-06 | 2016-10-05 | キヤノン株式会社 | 画像読取装置、画像読取装置の制御方法、プログラム、及び記憶媒体 |
US10866184B2 (en) * | 2015-11-06 | 2020-12-15 | California Institute Of Technology | Devices and methods for direct visual detection and readout of single nucleic acid molecules |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5943480A (ja) * | 1982-09-03 | 1984-03-10 | Ricoh Co Ltd | 文字認識方法 |
EP0381773B1 (en) * | 1988-07-20 | 1998-06-10 | Fujitsu Limited | Character recognition apparatus |
US5361309A (en) * | 1989-09-07 | 1994-11-01 | Canon Kabushiki Kaisha | Character recognition apparatus and method with low-resolution storage for character extraction |
US5309548A (en) * | 1989-09-21 | 1994-05-03 | Canon Kabushiki Kaisha | Pattern generating method and apparatus |
CA2036974C (en) * | 1990-02-26 | 1996-06-11 | Masayuki Kimura | Pattern recognition data processing device using an associative matching method |
US5091968A (en) * | 1990-12-28 | 1992-02-25 | Ncr Corporation | Optical character recognition system and method |
US5317654A (en) * | 1991-09-26 | 1994-05-31 | Inscerco Mfg. Inc. | Selective collating and inserting apparatus |
TW222337B (ja) * | 1992-09-02 | 1994-04-11 | Motorola Inc | |
US5337372A (en) * | 1992-10-13 | 1994-08-09 | At&T Bell Laboratories | Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions |
JP2979109B2 (ja) * | 1992-12-03 | 1999-11-15 | 日本アイ・ビー・エム 株式会社 | 認識文字の情報作成方法及び装置 |
JPH06274680A (ja) * | 1993-03-17 | 1994-09-30 | Hitachi Ltd | 文書認識方法およびシステム |
JPH07152865A (ja) | 1993-11-30 | 1995-06-16 | Canon Inc | 情報認識装置及びその方法 |
EP0677811A1 (en) * | 1994-04-15 | 1995-10-18 | Canon Kabushiki Kaisha | Image processing system with on-the-fly JPEG compression |
US5970170A (en) * | 1995-06-07 | 1999-10-19 | Kodak Limited | Character recognition system indentification of scanned and real time handwritten characters |
TW347503B (en) * | 1995-11-15 | 1998-12-11 | Hitachi Ltd | Character recognition translation system and voice recognition translation system |
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
JPH1132287A (ja) * | 1997-07-08 | 1999-02-02 | Fuji Photo Film Co Ltd | 画像ファイル作成方法および装置 |
US6041143A (en) * | 1998-04-14 | 2000-03-21 | Teralogic Incorporated | Multiresolution compressed image management system and method |
-
1999
- 1999-05-12 JP JP13150999A patent/JP4338155B2/ja not_active Expired - Fee Related
- 1999-06-08 DE DE69942165T patent/DE69942165D1/de not_active Expired - Fee Related
- 1999-06-08 EP EP99304479A patent/EP0964353B1/en not_active Expired - Lifetime
- 1999-06-10 US US09/329,202 patent/US6668101B2/en not_active Expired - Fee Related
- 1999-06-11 CN CNB991083679A patent/CN1149509C/zh not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7724977B2 (en) | 2001-07-12 | 2010-05-25 | Do Labs | Method and system for providing formatted data to image processing means in accordance with a standard format |
CN100350421C (zh) * | 2003-02-19 | 2007-11-21 | 索利斯蒂克有限公司 | 一种通过多个图象光识别邮件的方法 |
JP2016192070A (ja) * | 2015-03-31 | 2016-11-10 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
JPWO2017109998A1 (ja) * | 2015-12-25 | 2018-05-24 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
US10628713B2 (en) | 2015-12-25 | 2020-04-21 | Pfu Limited | Mobile terminal, image processing method, and computer-readable recording medium |
JP2020149159A (ja) * | 2019-03-11 | 2020-09-17 | 富士ゼロックス株式会社 | 画像形成装置、情報処理装置及びプログラム |
JP7326779B2 (ja) | 2019-03-11 | 2023-08-16 | 富士フイルムビジネスイノベーション株式会社 | 画像形成装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN1241758A (zh) | 2000-01-19 |
EP0964353A3 (en) | 2001-05-23 |
US6668101B2 (en) | 2003-12-23 |
JP4338155B2 (ja) | 2009-10-07 |
EP0964353B1 (en) | 2010-03-24 |
US20020122590A1 (en) | 2002-09-05 |
DE69942165D1 (de) | 2010-05-06 |
EP0964353A2 (en) | 1999-12-15 |
CN1149509C (zh) | 2004-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4338155B2 (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP5111268B2 (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
US7454060B2 (en) | Image processor for character recognition | |
US7805022B2 (en) | Image processing apparatus, image processing method and computer program | |
US7596271B2 (en) | Image processing system and image processing method | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US20060008113A1 (en) | Image processing system and image processing method | |
US20100002257A1 (en) | Image forming system | |
JP2007174317A (ja) | 画像処理装置及びプログラム | |
JP2000306103A (ja) | 情報処理装置及び方法 | |
JP4035228B2 (ja) | 画像処理方法及び画像処理装置 | |
US7126612B2 (en) | Image processing apparatus, image processing method, program, and storage medium | |
EP1574991A1 (en) | Similar image extraction device, similar image extraction method, and similar image extraction program | |
US6714682B2 (en) | Image processing device and method and memory medium | |
JP4920814B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
JP2000187670A (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP2001222717A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP2002024766A (ja) | 文字認識装置及び方法 | |
JP2002236921A (ja) | 文書画像認識方法、文書画像認識装置及び記録媒体 | |
JP2000306076A (ja) | 画像処理装置及び制御方法及び記憶媒体 | |
JP2000196867A (ja) | 画像処理方法及び装置 | |
JP2000172785A (ja) | 文字認識装置及びその方法、コンピュータ可読メモリ | |
JP2001219602A (ja) | 印刷システム及び印刷制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060511 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060511 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080729 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090629 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130710 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |