JP4140885B2 - Image processing apparatus, image processing method, and program - Google Patents
Image processing apparatus, image processing method, and program Download PDFInfo
- Publication number
- JP4140885B2 JP4140885B2 JP2002218180A JP2002218180A JP4140885B2 JP 4140885 B2 JP4140885 B2 JP 4140885B2 JP 2002218180 A JP2002218180 A JP 2002218180A JP 2002218180 A JP2002218180 A JP 2002218180A JP 4140885 B2 JP4140885 B2 JP 4140885B2
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- image
- document image
- image processing
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、画像処理装置、画像処理方法及びプログラムに関し、詳細には、スキャナ、デジタルカメラ等から取り込んだ文書画像の解像度を算出して、文字認識精度を向上させることのできる画像処理装置、画像処理方法及びプログラムに関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータの処理能力が飛躍的に向上して、画像データを容易に操作できるようになるに伴って、オフィスでの文書作成等においても画像データが数多く使用され、画像データは非常に重要なものとなってきている。
【0003】
このような状況下、手元にある文書を画像として簡単に取り込んで文字認識(OCR)したいという要求が高まりつつある。画像データを取得するには、デジタルカメラやスキャナで文書画像を入力して文字認識する方法がある。
【0004】
そして、デジタルカメラで文書画像を撮影する従来技術としては、例えば、被写体を撮影する撮影手段と、前記撮影手段による撮影時に、前記被写体までの距離を検出する検出手段と、前記検出手段によって検出された前記被写体までの距離と、前記撮影手段によって撮影された前記被写体の撮影画像のサイズとに基づいて、前記被写体のサイズを判別する判別手段と、前記判別手段によって判別された前記被写体のサイズに応じて、前記撮影手段によって撮影された撮影画像のサイズを補正し、補正した撮影画像を出力する補正出力手段と、を備えた撮影画像処理装置が提案されている(特開2001−14453号公報参照)。
【0005】
すなわち、この従来技術は、例えば、定型フォーマットをワープロで作成する場合には、当該定型フォーマットの文書をデジタルカメラで撮影することによって、定型フォーマットのサイズに応じた画像に自動的に補正し、撮像画像から実寸サイズの画像データを取得するものである。
【0006】
また、従来、デジタルカメラで撮影したデシタル画像を高解像度化し、また、OCR(文字認識)装置を組み込み、高解像度処理を行って認識率を高めるデジタルカメラが提案されている(特開平9−289624号公報参照)。
【0007】
すなわち、この従来技術は、デジタルカメラで撮影した画像に対して、高解像度化(画素密度変換)を行って、文字認識率を向上させるものである。
【0008】
【発明が解決しようとする課題】
しかしながら、このような従来公報記載の技術にあっては、文字認識率を向上させる上で、改良の必要があった。
【0009】
すなわち、文字認識(OCR)では、画像に適応するために、解像度情報を必要とすることが多い。
【0010】
ところが、特開2001−14453号公報記載の従来技術は、撮像画像から実寸サイズの画像データを得ているが、解像度が不明であり、文字認識率を向上させる上で問題であった。
【0011】
また、特開平9−289624号公報記載の従来技術にあっては、デジタルカメラで撮影した画像に対して、高解像度化(画素密度変換)を行っているが、誤差が生じる等の解像度の精度に問題があり、改良の必要があった。
【0012】
そこで、本発明は、デジタルカメラ等で取り込んだ文書画像の正確な解像度を求め、文字認識(OCR)の認識精度を向上させる画像処理装置、画像処理方法及びプログラムを提供することを目的としている。
【0013】
【課題を解決するための手段】
請求項1記載の発明の画像処理装置は、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定する手段と、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定する手段と、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とする手段とを有することを特徴とする。
【0014】
請求項2記載の発明の画像処理方法は、文書処理装置が、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定するステップと、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定するステップと、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップとを実行することを特徴とする。
【0015】
請求項3記載の発明のプログラムは、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定するステップと、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定するステップと、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップとをコンピュータに実行させるためのプログラムであることを特徴とする。
【0016】
【発明の実施の形態】
以下、本発明の好適な実施の形態を添付図面に基づいて詳細に説明する。なお、以下に述べる実施の形態は、本発明の好適な実施の形態であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの態様に限られるものではない。
【0017】
図1〜図3は、本発明の前提としての第1の実施の形態を説明する図であり、図1は、第1の実施の形態を適用した画像処理装置1の要部ブロック構成図である。
【0018】
図1において、画像処理装置1は、入力部2、文字サイズ推定部3、解像度推定部4及び出力部5等を備えている。
【0019】
入力部(入力手段)2は、文書画像を入力するものであり、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込んで、文字サイズ推定部3に出力する。
【0020】
文字サイズ推定部(文字サイズ推定手段)3は、入力部2から入力される文書画像から文字を抽出し、文字サイズを推定して、解像度推定部4に出力する。また、文字サイズ推定部3は、入力部2から入力されるデータが文書画像であるかチェックし、データが文書画像のときにのみ文字を抽出して、文字サイズを推定する。
【0021】
解像度推定部(解像度推定手段)4は、文字サイズ推定部3の推定した文字サイズに基づいて解像度を推定する。
【0022】
出力部5は、ディスプレイ表示、プリントアウト、音声等の出力を行うものであり、解像度推定部4の推定した解像度に基づいて、画像を出力する。
【0023】
この画像処理装置1は、図2に示すように、パーソナルコンピュータ等のコンピュータ(情報処理装置)10に、解像度推定方法のプログラム(解像度推定プログラム)を記録した例えば、CD(Compact Disc)やDVD(Digital Video Disk)等の所定の記録媒体20を読み取らせることで構築される。
【0024】
すなわち、コンピュータ10は、一般的に、図2に示すように、入力I/F11、CPU(Central Processing Unit )12、ドライブ13、メモリ14、出力I/F15及びネットワークコントローラ16等を備えており、主要各部は、バス17に接続されている。コンピュータ10は、ドライブ13にCDやDVD等の解像度推定プログラムの記録された記録媒体20を読み取って、導入することで、上記画像処理装置1として構築される。
【0025】
メモリ14は、例えば、ハードディスク等の大容量記憶媒体が用いられ、コンピュータ10の動作するOS(Operating System)や必要なプログラム及び上記記録媒体20から導入された解像度推定プログラムが格納される。
【0026】
CPU12は、メモリ14内のOS上で各種プログラム、特に、解像度推定プログラムを実行して、解像度推定処理を実行する。
【0027】
入力I/F11は、各種データの入力、特に、文書画像データの入力に用いられる。
【0028】
出力I/F15は、ディスプレイ、プリンタ、スピーカ及びネットワーク等が接続され、
各種データの出力、特に、文書画像の出力に用いられる。
【0029】
ネットワークコントローラ16は、データを、コンピュータ10の接続されている図示しないネットワークに出力するのに用いられる。
【0030】
次に、本実施の形態の作用を説明する。本実施の形態の画像処理装置1は、入力される文書画像の解像度を推定して、文字認識(OCR)を正確に行えるようにするところにその特徴がある。
【0031】
すなわち、画像処理装置1は、図3に示すように、まず、入力部2からの画像入力処理を行う(ステップS101)。この画像入力処理では、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0032】
画像処理装置1は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS102)、文書画像でないときには、そのまま当該データを出力部5から出力して、処理を終了する(ステップS105)。このデータが文書画像であるか否かの判断・文字抽出では、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0033】
ステップS102で、取り込んだデータが文書画像であると、文字サイズ推定部3が文字サイズを推定して、解像度推定部4に出力し(ステップS103)、解像度推定部4が解像度を推定する(ステップS104)。
【0034】
この入力された文書画像から文字サイズを推定するには、以下の方法を用いることができる。
【0035】
すなわち、推定される文字サイズ(画素)を、v、予め定められた定数(dpi/画素)を、N、推定解像度(dpi)を、R1としたとき、文字サイズ(画素)vを求めるには、画像を二値化して、連結部分を求め、その横・縦サイズのヒストグラムを求めて、最頻度を与える値を求める。Nは、定数であり、これは画像処理装置1毎に定められている。
【0036】
推定解像度R1は、ステップS103で求められた文字サイズvを用いて、以下のようにして求める。
【0037】
例えば、N=200/64(dpi/画素)としたとき、文字サイズvが、v=32(画素)であると、推定解像度R1は、R1=200/64×32、R1=100(dpi)となる。
【0038】
画像処理装置1は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS105)。
【0039】
このように、本実施の形態の画像処理装置1は、入力部2から入力される文書画像から
【0000】
当該文書画像の文字のサイズを文字サイズ推定部3で推定し、当該推定した文字サイズに
したがって、文書画像の文字サイズに基づいて解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0040】
図4〜図6は、本発明の前提としての第2の実施の形態を説明する図であり、図4は、 該第2の実施の形態を適用した画像処理装置30の要部ブロック構成図である。
【0041】
なお、本実施の形態の説明において、上記第1の実施の形態の画像処理装置1と同様の構成部分には、同一の符号を付して、その詳細な説明を省略する。
【0042】
図4において、画像処理装置30は、上記第1の実施の形態の画像処理装置1と同様の入力部2、解像度推定部4及び出力部5を備えているとともに、距離推定部31を備えており、第1の実施の形態の画像処理装置1の文字サイズ推定部3を備えていない。
【0043】
距離推定部(距離推定手段)31は、入力部2から文書画像までの距離を推定し、推定距離を解像度推定部4に出力する。
【0044】
解像度推定部4は、この推定距離に基づいて、画像の解像度を推定する。
【0045】
本実施の形態の画像処理装置30は、図5に示すように、まず、入力部2からの画像入力処理を行う(ステップS201)。この画像入力処理では、上記第1の実施の形態の場合と同様に、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0046】
画像処理装置30は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS202)、文書画像でないときには、そのまま当該データを出力部5から出力して、処理を終了する(ステップS205)。このデータが文書画像であるか否かの判断・文字抽出では、上記同様に、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0047】
ステップS202で、取り込んだデータが文書画像であると、距離推定部31が、入力部2から文書画像までの距離を推定して、解像度推定部4に出力し(ステップS203)、解像度推定部4が、解像度を推定する(ステップS204)。
【0048】
この入力された文書画像から解像度を推定するには、以下の方法を用いることができる。
【0049】
すなわち、図6に示すように、入力画像である文書画像までの推定される距離(m)を、l、予め定められた定数(dpi/画素)を、C、推定解像度(dpi)を、R2としたとき、距離(m)lを入力画像までの距離を実際に測定して求め、仮想の画像までの距離rでの解像度を200dpiとすると、r:200(dpi)=l(m):R2(dpi)、R2=(200/r)×lとなる。
【0050】
このとき、200/rを定数Cとする。この定数Cは、解像度推定装置30毎に定める。
【0051】
画像処理装置30は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS205)。
【0052】
このように、本実施の形態の画像処理装置30は、入力部2から入力される文書画像から当該文書画像までの距離を距離推定部31で推定し、当該推定した距離に基づいて、解像度推定部4で、文書画像の解像度を推定している。
【0053】
したがって、文書画像までの距離に基づいて解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0054】
図7及び図8は、本発明である第3の実施の形態を説明する図であり、図7は、該第3の実施の形態を適用した画像処理装置40の要部ブロック構成図である。
【0055】
本実施の形態は、上記第1の実施の形態と第2の実施の形態を併用したものである。本実施の形態の説明においても、上記第1の実施の形態の画像処理装置1と同様の構成部分には、同一の符号を付して、その詳細な説明を省略する。
【0056】
図7において、画像処理装置40は、上記第1の実施の形態の解像度推定装置1と同様の入力部2、解像度推定部4及び出力部5を備えているとともに、文字サイズ・距離推定部41を備えている。
【0057】
文字サイズ・距離推定部41は、文字サイズ推定部42と距離推定部43を備えている。
【0058】
文字サイズ推定部(文字サイズ推定手段)42は、第1の実施の形態の文字サイズ推定部3と同様に、入力部2から入力される文書画像から文字を抽出し、文字サイズを推定して、解像度推定部4に出力する。また、文字サイズ推定部42は、入力部2から入力されるデータが文書画像であるかチェックし、データが文書画像のときにのみ文字を抽出して、文字サイズを推定する。
【0059】
距離推定部(距離推定手段)43は、第2の実施の形態の距離推定部31と同様に、入力部2から文書画像までの距離を推定し、推定距離を解像度推定部4に出力する。
【0060】
本実施の形態の画像処理装置40は、図8に示すように、まず、入力部2からの画像入力処理を行う(ステップS301)。この画像入力処理では、上記第1の実施の形態の場合と同様に、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0061】
画像処理装置40は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS302)、文書画像でないときには、そのまま当該データを出力して、処理を終了する(ステップS306)。このデータが文書画像であるか否かの判断・文字抽出では、上記同様に、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0062】
ステップS302で、取り込んだデータが文書画像であると、まず、文字サイズ・距離推定部41の文字サイズ推定部42が、上記第1の実施の形態の場合と同様に、文字サイズ推定処理を行って文字サイズを推定して、解像度推定部4に出力し(ステップS303)、次に、距離推定部43が、上記第2の実施の形態の場合と同様に、距離推定処理を行って、入力部2から文書画像までの距離を推定して、解像度推定部4に出力する(ステップS304)。そして、解像度推定部4が、文字サイズと距離に基づいて解像度を推定する(ステップS305)。このとき、解像度推定部4は、ステップS303での文字サイズから上記第1の実施の形態の場合と同様に、解像度R1を算出し、また、ステップS304での距離から上記第2の実施の形態の場合と同様に、解像度R2を算出して、これら2つの解像度R1、R2を用いて、以下のように、最終的な解像度R3を算出する。
R3=(R1+R2)/2
【0063】
画像処理装置40は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS306)。
【0064】
このように、本実施の形態の画像処理装置40は、入力部2から入力される文書画像から当該文書画像の文字のサイズを文字サイズ・距離推定部41の文字サイズ推定部42で推定するとともに、当該文書画像までの距離を文字サイズ・距離推定部41の距離推定部43で推定し、当該推定した文字サイズと距離に基づいて、解像度推定部4で、文書画像の解像度を推定している。
【0065】
したがって、文書画像の文字サイズと文書画像までの距離に基づいて解像度を簡単かつより一層正確に算出することができ、文書画像の文字認識精度をより一層向上させることができる。
【0066】
図9は、本発明の実施の形態の画像処理装置を適用したデジタルカメラ50の要部ブロック構成図である。
【0067】
図9において、デジタルカメラ50は、入力I/F51、CPU52、メモリ53、ドライブ54、ネットワークコントローラ55及び出力I/F56等を備えている。
【0068】
ドライブ54は、主記憶となる大容量の記憶媒体であり、この大容量の記憶媒体にCDやDVD等の解像度推定プログラムの記録された記録媒体60を読み取って、導入することで、上記デジタルカメラ50を画像処理装置を内蔵したデジタルカメラとして構築することができる。
【0069】
入力I/F51は、画像を入力するためのインターフェースであり、CPU52は、ドライブ54のプログラムに基づいてデジタルカメラ50の各部を制御して、デジタルカメラ50として動作させるとともに、ドライブ54内に導入された解像度推定プログラムにより解像度推定処理を実行する。
【0070】
メモリ53は、画像データ等を記憶するための補助記憶媒体であり、ネットワークコントローラ55は、ネットワークに接続されてネットワーク上の機器との間でデータの授受を行う。出力I/F56は、画像データを出力するためのインターフェースである。
【0071】
本実施の形態では、図10に示すように、デジタルカメラ50を、被写体71に対して、自動で文章画像モードで撮影するように設定する。
【0072】
デジタルカメラ50は、被写体71までの距離を測定し、被写体71の輪郭等を抽出する。この輪郭抽出には、文字認識(OCR)等の一般的に知られている輪郭抽出処理のアルゴリズムを用いる。
【0073】
次に、デジタルカメラ50は、CPU52が、メモリ53やドライブ54の記憶媒体を用いて、解像度を算出し、この算出した解像度の推定値を画像ファイル72として出力I/F56から出力する。
【0074】
このように、本実施の形態のデジタルカメラ50は、文書画像を撮影可能なデジタルカメラ50に、解像度推定プログラムを搭載して、解像度推定処理を実行する画像処理装置としての機能を実現している。
【0075】
したがって、デジタルカメラ50で文書画像を撮影して、当該撮影した文書画像の解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0076】
また、上記各実施の形態において、記録媒体20、60に、入力画像の解像度を推定する解像度推定プログラムを記録して、当該記録媒体20、60の解像度推定プログラムをコンピュータ10等の情報処理装置やデジタルカメラ50に搭載させることで、解像度推定処理を実行するデジタルカメラ50を構築している。
【0077】
したがって、文書画像の解像度を簡単かつ正確に算出して、文書画像の文字認識精度をより一層向上させる画像処理装置及び解像度推定方法を実行するデジタルカメラ50を容易に構築することができる。
【0078】
以上、本発明者によってなされた発明を好適な実施の形態に基づき具体的に説明したが、本発明は上記のものに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0079】
【発明の効果】
本発明によれば、文書画像の文字サイズと文書画像までの距離に基づいて当該文書画像の解像度を簡単かつより一層正確に算出することができ、文書画像の文字認識精度をより一層向上させることができる。
【図面の簡単な説明】
【図1】 本発明の前提の第1の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図2】 図1の画像処理装置の適用されるコンピュータの要部ブロック構成図。
【図3】 図1の画像処理装置による解像度推定処理を示すフローチャート。
【図4】本発明の前提の第2の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図5】 図4の画像処理装置による解像度推定処理を示すフローチャート。
【図6】 図4の画像処理装置による距離推定処理の説明図。
【図7】 本発明としての第3の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図8】 図7の画像処理装置による解像度推定処理を示すフローチャート。
【図9】 本発明の画像処理装置を適用したデジタルカメラの要部ブロック構成図。
【図10】 図9のデジタルカメラによる解像度推定処理の説明図。
【符号の説明】
1 画像処理装置
2 入力部
3 文字サイズ推定部
4 解像度推定部
5 出力部
10 コンピュータ
11 入力I/F
12 CPU
13 ドライブ
14 メモリ
15 出力I/F
16 ネットワークコントローラ
17 バス
20 記録媒体
30 画像処理装置
31 距離推定部
40 画像処理装置
41 文字サイズ・距離推定部
42 文字サイズ推定部
43 距離推定部
50 デジタルカメラ
51 入力I/F
52 CPU
53 メモリ
54 ドライブ
55 ネットワークコントローラ
56 出力I/F
60 記録媒体
71 被写体
72 画像ファイル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, an image processing method, and a program , and more specifically, an image processing apparatus capable of calculating the resolution of a document image captured from a scanner, a digital camera, or the like to improve character recognition accuracy, and an image The present invention relates to a processing method and a program .
[0002]
[Prior art]
In recent years, as the processing power of personal computers has dramatically improved and image data can be easily manipulated, a lot of image data is used in document creation in offices, and image data is very important. It has become a thing.
[0003]
Under such circumstances, there is an increasing demand for easily capturing a document at hand as an image and performing character recognition (OCR). To obtain image data, there is a method of recognizing characters by inputting a document image with a digital camera or a scanner.
[0004]
As a conventional technique for photographing a document image with a digital camera, for example, a photographing means for photographing a subject, a detecting means for detecting a distance to the subject at the time of photographing by the photographing means, and a detection means. A determination means for determining the size of the subject based on a distance to the subject and a size of a photographed image of the subject photographed by the photographing means; and a size of the subject determined by the determination means. Accordingly, there has been proposed a photographic image processing apparatus including correction output means for correcting the size of a photographic image taken by the photographic means and outputting the corrected photographic image (Japanese Patent Laid-Open No. 2001-14453). reference).
[0005]
That is, for example, when a standard format is created by a word processor, this conventional technique automatically corrects an image corresponding to the size of the standard format by photographing a document of the standard format with a digital camera. The actual size image data is acquired from the image.
[0006]
Conventionally, there has been proposed a digital camera that increases the resolution of a digital image taken with a digital camera and incorporates an OCR (character recognition) device to perform high resolution processing to increase the recognition rate (Japanese Patent Laid-Open No. 9-289624). No. publication).
[0007]
In other words, this conventional technique increases the resolution (pixel density conversion) of an image taken with a digital camera to improve the character recognition rate.
[0008]
[Problems to be solved by the invention]
However, in the technique described in the conventional publication, it is necessary to improve the character recognition rate.
[0009]
That is, in character recognition (OCR), resolution information is often required to adapt to an image.
[0010]
However, the conventional technology described in Japanese Patent Application Laid-Open No. 2001-14453 obtains actual size image data from a captured image, but the resolution is unknown, which is a problem in improving the character recognition rate.
[0011]
In the prior art described in Japanese Patent Laid-Open No. 9-289624, the resolution of a picture taken with a digital camera is increased (pixel density conversion), but the resolution accuracy such as an error is generated. There was a problem, and there was a need for improvement.
[0012]
SUMMARY An advantage of some aspects of the invention is that it provides an image processing apparatus, an image processing method, and a program for obtaining an accurate resolution of a document image captured by a digital camera or the like and improving the recognition accuracy of character recognition (OCR).
[0013]
[Means for Solving the Problems]
The image processing apparatus according to the first aspect of the present invention provides a means for estimating the resolution (first resolution) of the document image based on the character size of the document image, and the document image based on the distance to the document image. It has means for estimating the resolution (second resolution) and means for setting the average of the estimated first resolution and second resolution as the resolution of the document image.
[0014]
According to the image processing method of the present invention, the document processing apparatus estimates the resolution (first resolution) of the document image based on the character size of the document image, and based on the distance to the document image. And executing the step of estimating the resolution (second resolution) of the document image and setting the average of the estimated first resolution and second resolution as the resolution of the document image. To do.
[0015]
According to a third aspect of the present invention, there is provided a program for estimating a resolution (first resolution) of a document image based on a character size of the document image, and a resolution of the document image based on a distance to the document image ( (2nd resolution) and a program for causing a computer to execute a step of setting an average of the estimated first resolution and second resolution as the resolution of the document image. To do.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described in detail with reference to the accompanying drawings. The embodiments described below are preferred embodiments of the present invention, and thus various technically preferable limitations are given. However, the scope of the present invention is particularly limited in the following description. As long as there is no description which limits, it is not restricted to these aspects.
[0017]
1 to 3 are diagrams for explaining a first embodiment as a premise of the present invention. FIG. 1 is a block diagram of a main part of an
[0018]
In FIG. 1, the
[0019]
The input unit (input unit) 2 inputs a document image, and takes in a document image obtained by photographing a subject from a silver salt photograph or a lens of a digital camera, or takes a photograph image as document image data using a scanner. , Output to the character
[0020]
The character size estimation unit (character size estimation means) 3 extracts characters from the document image input from the
[0021]
The resolution estimation unit (resolution estimation unit) 4 estimates the resolution based on the character size estimated by the character
[0022]
The
[0023]
As shown in FIG. 2, the
[0024]
That is, the
[0025]
The
[0026]
The
[0027]
The input I / F 11 is used for inputting various data, particularly for inputting document image data.
[0028]
The output I /
It is used for outputting various data, particularly for outputting document images.
[0029]
The
[0030]
Next, the operation of the present embodiment will be described. The
[0031]
That is, as shown in FIG. 3, the
[0032]
When the
[0033]
If the captured data is a document image in step S102, the character
[0034]
In order to estimate the character size from the input document image, the following method can be used.
[0035]
That is, when the estimated character size (pixel) is v, a predetermined constant (dpi / pixel) is N, and the estimated resolution (dpi) is R1, the character size (pixel) v is obtained. The image is binarized to obtain a connected portion, and a horizontal / vertical size histogram is obtained to obtain a value giving the maximum frequency. N is a constant, which is determined for each
[0036]
The estimated resolution R1 is obtained as follows using the character size v obtained in step S103.
[0037]
For example, when N = 200/64 (dpi / pixel) and the character size v is v = 32 (pixel), the estimated resolution R1 is R1 = 200/64 × 32, R1 = 100 (dpi) It becomes.
[0038]
Thereafter, the
[0039]
As described above, the
The character
[0040]
4 to 6 are diagrams for explaining a second embodiment as a premise of the present invention, and FIG. 4 is a block diagram of a main part of an
[0041]
In the description of the present embodiment, the same components as those of the
[0042]
In FIG. 4, the
[0043]
The distance estimation unit (distance estimation unit) 31 estimates the distance from the
[0044]
The resolution estimation unit 4 estimates the resolution of the image based on the estimated distance.
[0045]
As shown in FIG. 5, the
[0046]
When the
[0047]
If the captured data is a document image in step S202, the distance estimation unit 31 estimates the distance from the
[0048]
In order to estimate the resolution from the input document image, the following method can be used.
[0049]
That is, as shown in FIG. 6, the estimated distance (m) to the document image that is the input image is l, the predetermined constant (dpi / pixel) is C, the estimated resolution (dpi) is R2 When the distance (m) l is obtained by actually measuring the distance to the input image, and the resolution at the distance r to the virtual image is 200 dpi, r: 200 (dpi) = 1 (m): R2 (dpi), R2 = (200 / r) × l.
[0050]
At this time, 200 / r is a constant C. This constant C is determined for each
[0051]
The
[0052]
As described above, the
[0053]
Therefore, the resolution can be calculated easily and accurately based on the distance to the document image, and the character recognition accuracy of the document image can be improved.
[0054]
FIGS. 7 and 8 are diagrams for explaining a third embodiment of the present invention. FIG. 7 is a block diagram of a main part of an
[0055]
This embodiment is a combination of the first embodiment and the second embodiment. Also in the description of the present embodiment , the same components as those of the
[0056]
In FIG. 7, an
[0057]
The character size /
[0058]
The character size estimation unit (character size estimation means) 42 extracts characters from the document image input from the
[0059]
The distance estimation unit (distance estimation unit) 43 estimates the distance from the
[0060]
As shown in FIG. 8, the
[0061]
When the
[0062]
If the captured data is a document image in step S302, first, the character size estimation unit 42 of the character size /
R3 = (R1 + R2) / 2
[0063]
The
[0064]
As described above, the
[0065]
Therefore, the resolution can be calculated easily and more accurately based on the character size of the document image and the distance to the document image, and the character recognition accuracy of the document image can be further improved.
[0066]
FIG. 9 is a block diagram of a main part of a
[0067]
In FIG. 9, the
[0068]
The drive 54 is a large-capacity storage medium serving as a main storage, and the digital camera is read by introducing a recording medium 60 recorded with a resolution estimation program such as a CD or a DVD into the large-capacity storage medium. 50 can be constructed as a digital camera incorporating an image processing device .
[0069]
The input I /
[0070]
The
[0071]
In the present embodiment, as shown in FIG. 10, the
[0072]
The
[0073]
Next, in the
[0074]
As described above, the
[0075]
Therefore, a document image can be photographed with the
[0076]
In each of the above embodiments, a resolution estimation program for estimating the resolution of the input image is recorded in the recording media 20 and 60, and the resolution estimation program for the recording media 20 and 60 is stored in an information processing apparatus such as the
[0077]
Therefore, it is possible to easily construct the image processing apparatus and the
[0078]
The invention made by the present inventor has been specifically described based on the preferred embodiments. However, the present invention is not limited to the above, and various modifications can be made without departing from the scope of the invention. Needless to say.
[0079]
【The invention's effect】
According to the present invention, the resolution of a document image can be calculated easily and more accurately based on the character size of the document image and the distance to the document image, and the character recognition accuracy of the document image can be further improved. Can do.
[Brief description of the drawings]
FIG. 1 is a block diagram of a main part of an image processing apparatus to which a first embodiment of the present invention is applied .
FIG. 2 is a block diagram of a main part of a computer to which the image processing apparatus of FIG. 1 is applied.
FIG. 3 is a flowchart showing resolution estimation processing by the image processing apparatus of FIG. 1;
FIG. 4 is a block diagram of a main part of an image processing apparatus to which a second embodiment on the premise of the present invention is applied .
FIG. 5 is a flowchart showing resolution estimation processing by the image processing apparatus of FIG. 4;
6 is an explanatory diagram of distance estimation processing by the image processing apparatus of FIG. 4;
FIG. 7 is a block diagram of a main part of an image processing apparatus to which a third embodiment of the present invention is applied .
8 is a flowchart showing resolution estimation processing by the image processing apparatus in FIG. 7;
FIG. 9 is a block diagram of the main part of a digital camera to which the image processing apparatus of the present invention is applied.
10 is an explanatory diagram of resolution estimation processing by the digital camera of FIG. 9;
[Explanation of symbols]
1
12 CPU
13
16 Network controller 17 Bus 20
52 CPU
53 Memory 54
60 Recording medium 71 Subject 72 Image file
Claims (3)
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定する手段と、Means for estimating a resolution of the document image (hereinafter, second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とする手段と、Means for taking the average of the estimated first resolution and second resolution as the resolution of the document image;
を有することを特徴とする画像処理装置。An image processing apparatus comprising:
文書画像の文字サイズに基づいて当該文書画像の解像度(以下、第1の解像度)を推定するステップと、Estimating the resolution of the document image (hereinafter, first resolution) based on the character size of the document image;
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定するステップと、Estimating a resolution of the document image (hereinafter referred to as a second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップと、Taking the average of the estimated first resolution and second resolution as the resolution of the document image;
を実行することを特徴とする画像処方法。The image processing method characterized by performing.
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定するステップと、Estimating a resolution of the document image (hereinafter referred to as a second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップと、Taking the average of the estimated first resolution and second resolution as the resolution of the document image;
をコンピュータに実行させるためのプログラム。A program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002218180A JP4140885B2 (en) | 2002-07-26 | 2002-07-26 | Image processing apparatus, image processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002218180A JP4140885B2 (en) | 2002-07-26 | 2002-07-26 | Image processing apparatus, image processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004062400A JP2004062400A (en) | 2004-02-26 |
JP4140885B2 true JP4140885B2 (en) | 2008-08-27 |
Family
ID=31939443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002218180A Expired - Fee Related JP4140885B2 (en) | 2002-07-26 | 2002-07-26 | Image processing apparatus, image processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4140885B2 (en) |
-
2002
- 2002-07-26 JP JP2002218180A patent/JP4140885B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004062400A (en) | 2004-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009064421A (en) | Method for encoding depth data, depth map creation device, and electronic device | |
US8441554B2 (en) | Image capturing apparatus capable of extracting subject region from captured image | |
WO2012075817A1 (en) | Text image trimming method | |
JP2003234888A (en) | Image correction device, program, storage medium, and method for correcting image | |
US8588550B2 (en) | Virtual level for a digital camera | |
US7319778B2 (en) | Image processing apparatus | |
JP4200419B2 (en) | PHOTO EXTRACTION METHOD, DEVICE, PROGRAM, AND RECORDING MEDIUM | |
JP4894708B2 (en) | Imaging device | |
CN101631251B (en) | Image processing apparatus and method thereof | |
JP4145014B2 (en) | Image processing device | |
JP5111255B2 (en) | Image processing apparatus, image processing method, computer program, and recording medium | |
JP2004185386A (en) | Image collating unit | |
JP4140885B2 (en) | Image processing apparatus, image processing method, and program | |
JP5365327B2 (en) | Subject tracking device and camera | |
US8131101B2 (en) | Image processing method and image processing apparatus | |
JP5029647B2 (en) | Subject tracking device and camera | |
JP2012095231A (en) | Form image management system, form image management method, and program | |
JP3881455B2 (en) | Image correction apparatus, image correction method, and medium on which image correction method is recorded | |
JP2006268493A (en) | Image processor, image processing method program and recording medium | |
JPH11220683A (en) | Image processor and method therefor and storage medium | |
JP5336798B2 (en) | Image processing apparatus, image processing method, and program | |
JP2010074312A (en) | Image processing apparatus and method, and program | |
JP2003189082A (en) | Image distortion correcting apparatus, program, storage medium thereof and method therefor | |
JP6922690B2 (en) | Character area extraction program, character area extraction device and character area extraction method | |
JP4235519B2 (en) | Image forming system, image forming apparatus, control method therefor, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050223 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050418 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080604 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080606 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130620 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |