JP4140885B2 - Image processing apparatus, image processing method, and program - Google Patents

Image processing apparatus, image processing method, and program Download PDF

Info

Publication number
JP4140885B2
JP4140885B2 JP2002218180A JP2002218180A JP4140885B2 JP 4140885 B2 JP4140885 B2 JP 4140885B2 JP 2002218180 A JP2002218180 A JP 2002218180A JP 2002218180 A JP2002218180 A JP 2002218180A JP 4140885 B2 JP4140885 B2 JP 4140885B2
Authority
JP
Japan
Prior art keywords
resolution
image
document image
image processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002218180A
Other languages
Japanese (ja)
Other versions
JP2004062400A (en
Inventor
優 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002218180A priority Critical patent/JP4140885B2/en
Publication of JP2004062400A publication Critical patent/JP2004062400A/en
Application granted granted Critical
Publication of JP4140885B2 publication Critical patent/JP4140885B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置、画像処理方法及びプログラムに関し、詳細には、スキャナ、デジタルカメラ等から取り込んだ文書画像の解像度を算出して、文字認識精度を向上させることのできる画像処理装置、画像処理方法及びプログラムに関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータの処理能力が飛躍的に向上して、画像データを容易に操作できるようになるに伴って、オフィスでの文書作成等においても画像データが数多く使用され、画像データは非常に重要なものとなってきている。
【0003】
このような状況下、手元にある文書を画像として簡単に取り込んで文字認識(OCR)したいという要求が高まりつつある。画像データを取得するには、デジタルカメラやスキャナで文書画像を入力して文字認識する方法がある。
【0004】
そして、デジタルカメラで文書画像を撮影する従来技術としては、例えば、被写体を撮影する撮影手段と、前記撮影手段による撮影時に、前記被写体までの距離を検出する検出手段と、前記検出手段によって検出された前記被写体までの距離と、前記撮影手段によって撮影された前記被写体の撮影画像のサイズとに基づいて、前記被写体のサイズを判別する判別手段と、前記判別手段によって判別された前記被写体のサイズに応じて、前記撮影手段によって撮影された撮影画像のサイズを補正し、補正した撮影画像を出力する補正出力手段と、を備えた撮影画像処理装置が提案されている(特開2001−14453号公報参照)。
【0005】
すなわち、この従来技術は、例えば、定型フォーマットをワープロで作成する場合には、当該定型フォーマットの文書をデジタルカメラで撮影することによって、定型フォーマットのサイズに応じた画像に自動的に補正し、撮像画像から実寸サイズの画像データを取得するものである。
【0006】
また、従来、デジタルカメラで撮影したデシタル画像を高解像度化し、また、OCR(文字認識)装置を組み込み、高解像度処理を行って認識率を高めるデジタルカメラが提案されている(特開平9−289624号公報参照)。
【0007】
すなわち、この従来技術は、デジタルカメラで撮影した画像に対して、高解像度化(画素密度変換)を行って、文字認識率を向上させるものである。
【0008】
【発明が解決しようとする課題】
しかしながら、このような従来公報記載の技術にあっては、文字認識率を向上させる上で、改良の必要があった。
【0009】
すなわち、文字認識(OCR)では、画像に適応するために、解像度情報を必要とすることが多い。
【0010】
ところが、特開2001−14453号公報記載の従来技術は、撮像画像から実寸サイズの画像データを得ているが、解像度が不明であり、文字認識率を向上させる上で問題であった。
【0011】
また、特開平9−289624号公報記載の従来技術にあっては、デジタルカメラで撮影した画像に対して、高解像度化(画素密度変換)を行っているが、誤差が生じる等の解像度の精度に問題があり、改良の必要があった。
【0012】
そこで、本発明は、デジタルカメラ等で取り込んだ文書画像の正確な解像度を求め、文字認識(OCR)の認識精度を向上させる画像処理装置、画像処理方法及びプログラムを提供することを目的としている。
【0013】
【課題を解決するための手段】
請求項1記載の発明の画像処理装置は、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定する手段と、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定する手段と、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とする手段とを有することを特徴とする。
【0014】
請求項2記載の発明の画像処理方法は、文書処理装置が、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定するステップと、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定するステップと、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップとを実行することを特徴とする。
【0015】
請求項3記載の発明のプログラムは、文書画像の文字サイズに基づいて当該文書画像の解像度(第1の解像度)を推定するステップと、前記文書画像までの距離に基づいて当該文書画像の解像度(第2の解像度)を推定するステップと、前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップとをコンピュータに実行させるためのプログラムであることを特徴とする。
【0016】
【発明の実施の形態】
以下、本発明の好適な実施の形態を添付図面に基づいて詳細に説明する。なお、以下に述べる実施の形態は、本発明の好適な実施の形態であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの態様に限られるものではない。
【0017】
図1〜図3は、本発明の前提としての第1の実施の形態を説明する図であり、図1は、第1の実施の形態を適用した画像処理装置1の要部ブロック構成図である。
【0018】
図1において、画像処理装置1は、入力部2、文字サイズ推定部3、解像度推定部4及び出力部5等を備えている。
【0019】
入力部(入力手段)2は、文書画像を入力するものであり、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込んで、文字サイズ推定部3に出力する。
【0020】
文字サイズ推定部(文字サイズ推定手段)3は、入力部2から入力される文書画像から文字を抽出し、文字サイズを推定して、解像度推定部4に出力する。また、文字サイズ推定部3は、入力部2から入力されるデータが文書画像であるかチェックし、データが文書画像のときにのみ文字を抽出して、文字サイズを推定する。
【0021】
解像度推定部(解像度推定手段)4は、文字サイズ推定部3の推定した文字サイズに基づいて解像度を推定する。
【0022】
出力部5は、ディスプレイ表示、プリントアウト、音声等の出力を行うものであり、解像度推定部4の推定した解像度に基づいて、画像を出力する。
【0023】
この画像処理装置1は、図2に示すように、パーソナルコンピュータ等のコンピュータ(情報処理装置)10に、解像度推定方法のプログラム(解像度推定プログラム)を記録した例えば、CD(Compact Disc)やDVD(Digital Video Disk)等の所定の記録媒体20を読み取らせることで構築される。
【0024】
すなわち、コンピュータ10は、一般的に、図2に示すように、入力I/F11、CPU(Central Processing Unit )12、ドライブ13、メモリ14、出力I/F15及びネットワークコントローラ16等を備えており、主要各部は、バス17に接続されている。コンピュータ10は、ドライブ13にCDやDVD等の解像度推定プログラムの記録された記録媒体20を読み取って、導入することで、上記画像処理装置1として構築される。
【0025】
メモリ14は、例えば、ハードディスク等の大容量記憶媒体が用いられ、コンピュータ10の動作するOS(Operating System)や必要なプログラム及び上記記録媒体20から導入された解像度推定プログラムが格納される。
【0026】
CPU12は、メモリ14内のOS上で各種プログラム、特に、解像度推定プログラムを実行して、解像度推定処理を実行する。
【0027】
入力I/F11は、各種データの入力、特に、文書画像データの入力に用いられる。
【0028】
出力I/F15は、ディスプレイ、プリンタ、スピーカ及びネットワーク等が接続され、
各種データの出力、特に、文書画像の出力に用いられる。
【0029】
ネットワークコントローラ16は、データを、コンピュータ10の接続されている図示しないネットワークに出力するのに用いられる。
【0030】
次に、本実施の形態の作用を説明する。本実施の形態の画像処理装置1は、入力される文書画像の解像度を推定して、文字認識(OCR)を正確に行えるようにするところにその特徴がある。
【0031】
すなわち、画像処理装置1は、図3に示すように、まず、入力部2からの画像入力処理を行う(ステップS101)。この画像入力処理では、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0032】
画像処理装置1は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS102)、文書画像でないときには、そのまま当該データを出力部5から出力して、処理を終了する(ステップS105)。このデータが文書画像であるか否かの判断・文字抽出では、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0033】
ステップS102で、取り込んだデータが文書画像であると、文字サイズ推定部3が文字サイズを推定して、解像度推定部4に出力し(ステップS103)、解像度推定部4が解像度を推定する(ステップS104)。
【0034】
この入力された文書画像から文字サイズを推定するには、以下の方法を用いることができる。
【0035】
すなわち、推定される文字サイズ(画素)を、v、予め定められた定数(dpi/画素)を、N、推定解像度(dpi)を、R1としたとき、文字サイズ(画素)vを求めるには、画像を二値化して、連結部分を求め、その横・縦サイズのヒストグラムを求めて、最頻度を与える値を求める。Nは、定数であり、これは画像処理装置1毎に定められている。
【0036】
推定解像度R1は、ステップS103で求められた文字サイズvを用いて、以下のようにして求める。
【0037】
例えば、N=200/64(dpi/画素)としたとき、文字サイズvが、v=32(画素)であると、推定解像度R1は、R1=200/64×32、R1=100(dpi)となる。
【0038】
画像処理装置1は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS105)。
【0039】
このように、本実施の形態の画像処理装置1は、入力部2から入力される文書画像から
【0000】
当該文書画像の文字のサイズを文字サイズ推定部3で推定し、当該推定した文字サイズに
したがって、文書画像の文字サイズに基づいて解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0040】
図4〜図6は、本発明の前提としての第2の実施の形態を説明する図であり、図4は、 該第2の実施の形態を適用した画像処理装置30の要部ブロック構成図である。
【0041】
なお、本実施の形態の説明において、上記第1の実施の形態の画像処理装置1と同様の構成部分には、同一の符号を付して、その詳細な説明を省略する。
【0042】
図4において、画像処理装置30は、上記第1の実施の形態の画像処理装置1と同様の入力部2、解像度推定部4及び出力部5を備えているとともに、距離推定部31を備えており、第1の実施の形態の画像処理装置1の文字サイズ推定部3を備えていない。
【0043】
距離推定部(距離推定手段)31は、入力部2から文書画像までの距離を推定し、推定距離を解像度推定部4に出力する。
【0044】
解像度推定部4は、この推定距離に基づいて、画像の解像度を推定する。
【0045】
本実施の形態の画像処理装置30は、図5に示すように、まず、入力部2からの画像入力処理を行う(ステップS201)。この画像入力処理では、上記第1の実施の形態の場合と同様に、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0046】
画像処理装置30は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS202)、文書画像でないときには、そのまま当該データを出力部5から出力して、処理を終了する(ステップS205)。このデータが文書画像であるか否かの判断・文字抽出では、上記同様に、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0047】
ステップS202で、取り込んだデータが文書画像であると、距離推定部31が、入力部2から文書画像までの距離を推定して、解像度推定部4に出力し(ステップS203)、解像度推定部4が、解像度を推定する(ステップS204)。
【0048】
この入力された文書画像から解像度を推定するには、以下の方法を用いることができる。
【0049】
すなわち、図6に示すように、入力画像である文書画像までの推定される距離(m)を、l、予め定められた定数(dpi/画素)を、C、推定解像度(dpi)を、R2としたとき、距離(m)lを入力画像までの距離を実際に測定して求め、仮想の画像までの距離rでの解像度を200dpiとすると、r:200(dpi)=l(m):R2(dpi)、R2=(200/r)×lとなる。
【0050】
このとき、200/rを定数Cとする。この定数Cは、解像度推定装置30毎に定める。
【0051】
画像処理装置30は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS205)。
【0052】
このように、本実施の形態の画像処理装置30は、入力部2から入力される文書画像から当該文書画像までの距離を距離推定部31で推定し、当該推定した距離に基づいて、解像度推定部4で、文書画像の解像度を推定している。
【0053】
したがって、文書画像までの距離に基づいて解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0054】
図7及び図8は、本発明である第3の実施の形態を説明する図であり、図7は、該第3の実施の形態を適用した画像処理装置40の要部ブロック構成図である。
【0055】
本実施の形態は、上記第1の実施の形態と第2の実施の形態を併用したものである。本実施の形態の説明においても、上記第1の実施の形態の画像処理装置1と同様の構成部分には、同一の符号を付して、その詳細な説明を省略する。
【0056】
図7において、画像処理装置40は、上記第1の実施の形態の解像度推定装置1と同様の入力部2、解像度推定部4及び出力部5を備えているとともに、文字サイズ・距離推定部41を備えている。
【0057】
文字サイズ・距離推定部41は、文字サイズ推定部42と距離推定部43を備えている。
【0058】
文字サイズ推定部(文字サイズ推定手段)42は、第1の実施の形態の文字サイズ推定部3と同様に、入力部2から入力される文書画像から文字を抽出し、文字サイズを推定して、解像度推定部4に出力する。また、文字サイズ推定部42は、入力部2から入力されるデータが文書画像であるかチェックし、データが文書画像のときにのみ文字を抽出して、文字サイズを推定する。
【0059】
距離推定部(距離推定手段)43は、第2の実施の形態の距離推定部31と同様に、入力部2から文書画像までの距離を推定し、推定距離を解像度推定部4に出力する。
【0060】
本実施の形態の画像処理装置40は、図8に示すように、まず、入力部2からの画像入力処理を行う(ステップS301)。この画像入力処理では、上記第1の実施の形態の場合と同様に、銀塩写真またはデジタルカメラのレンズから被写体を撮影した文書画像を取り込んだり、スキャナを用いて写真画像を文書画像データとして取り込む。
【0061】
画像処理装置40は、データを取り込むと、取り込んだデータが文書画像であるかをチェックし(ステップS302)、文書画像でないときには、そのまま当該データを出力して、処理を終了する(ステップS306)。このデータが文書画像であるか否かの判断・文字抽出では、上記同様に、一般的に知られている文字認識(OCR)処理で用いられている機能を用いることができる。
【0062】
ステップS302で、取り込んだデータが文書画像であると、まず、文字サイズ・距離推定部41の文字サイズ推定部42が、上記第1の実施の形態の場合と同様に、文字サイズ推定処理を行って文字サイズを推定して、解像度推定部4に出力し(ステップS303)、次に、距離推定部43が、上記第2の実施の形態の場合と同様に、距離推定処理を行って、入力部2から文書画像までの距離を推定して、解像度推定部4に出力する(ステップS304)。そして、解像度推定部4が、文字サイズと距離に基づいて解像度を推定する(ステップS305)。このとき、解像度推定部4は、ステップS303での文字サイズから上記第1の実施の形態の場合と同様に、解像度R1を算出し、また、ステップS304での距離から上記第2の実施の形態の場合と同様に、解像度R2を算出して、これら2つの解像度R1、R2を用いて、以下のように、最終的な解像度R3を算出する。
R3=(R1+R2)/2
【0063】
画像処理装置40は、その後、解像度の情報をディスプレイ表示、プリントアウト、音声等の出力部5に出力するか、または、画像の付加情報部分に組み入れてディスプレイ表示、プリントアウト、音声等の出力部5に出力して、処理を終了する(ステップS306)。
【0064】
このように、本実施の形態の画像処理装置40は、入力部2から入力される文書画像から当該文書画像の文字のサイズを文字サイズ・距離推定部41の文字サイズ推定部42で推定するとともに、当該文書画像までの距離を文字サイズ・距離推定部41の距離推定部43で推定し、当該推定した文字サイズと距離に基づいて、解像度推定部4で、文書画像の解像度を推定している。
【0065】
したがって、文書画像の文字サイズと文書画像までの距離に基づいて解像度を簡単かつより一層正確に算出することができ、文書画像の文字認識精度をより一層向上させることができる。
【0066】
図9は、本発明の実施の形態の画像処理装置を適用したデジタルカメラ50の要部ブロック構成図である。
【0067】
図9において、デジタルカメラ50は、入力I/F51、CPU52、メモリ53、ドライブ54、ネットワークコントローラ55及び出力I/F56等を備えている。
【0068】
ドライブ54は、主記憶となる大容量の記憶媒体であり、この大容量の記憶媒体にCDやDVD等の解像度推定プログラムの記録された記録媒体60を読み取って、導入することで、上記デジタルカメラ50を画像処理装置を内蔵したデジタルカメラとして構築することができる。
【0069】
入力I/F51は、画像を入力するためのインターフェースであり、CPU52は、ドライブ54のプログラムに基づいてデジタルカメラ50の各部を制御して、デジタルカメラ50として動作させるとともに、ドライブ54内に導入された解像度推定プログラムにより解像度推定処理を実行する。
【0070】
メモリ53は、画像データ等を記憶するための補助記憶媒体であり、ネットワークコントローラ55は、ネットワークに接続されてネットワーク上の機器との間でデータの授受を行う。出力I/F56は、画像データを出力するためのインターフェースである。
【0071】
本実施の形態では、図10に示すように、デジタルカメラ50を、被写体71に対して、自動で文章画像モードで撮影するように設定する。
【0072】
デジタルカメラ50は、被写体71までの距離を測定し、被写体71の輪郭等を抽出する。この輪郭抽出には、文字認識(OCR)等の一般的に知られている輪郭抽出処理のアルゴリズムを用いる。
【0073】
次に、デジタルカメラ50は、CPU52が、メモリ53やドライブ54の記憶媒体を用いて、解像度を算出し、この算出した解像度の推定値を画像ファイル72として出力I/F56から出力する。
【0074】
このように、本実施の形態のデジタルカメラ50は、文書画像を撮影可能なデジタルカメラ50に、解像度推定プログラムを搭載して、解像度推定処理を実行する画像処理装置としての機能を実現している。
【0075】
したがって、デジタルカメラ50で文書画像を撮影して、当該撮影した文書画像の解像度を簡単かつ正確に算出することができ、文書画像の文字認識精度を向上させることができる。
【0076】
また、上記各実施の形態において、記録媒体20、60に、入力画像の解像度を推定する解像度推定プログラムを記録して、当該記録媒体20、60の解像度推定プログラムをコンピュータ10等の情報処理装置やデジタルカメラ50に搭載させることで、解像度推定処理を実行するデジタルカメラ50を構築している。
【0077】
したがって、文書画像の解像度を簡単かつ正確に算出して、文書画像の文字認識精度をより一層向上させる画像処理装置及び解像度推定方法を実行するデジタルカメラ50を容易に構築することができる。
【0078】
以上、本発明者によってなされた発明を好適な実施の形態に基づき具体的に説明したが、本発明は上記のものに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0079】
【発明の効果】
本発明によれば、文書画像の文字サイズと文書画像までの距離に基づいて当該文書画像の解像度を簡単かつより一層正確に算出することができ、文書画像の文字認識精度をより一層向上させることができる。
【図面の簡単な説明】
【図1】 本発明の前提の第1の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図2】 図1の画像処理装置の適用されるコンピュータの要部ブロック構成図。
【図3】 図1の画像処理装置による解像度推定処理を示すフローチャート。
【図4】本発明の前提の第2の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図5】 図4の画像処理装置による解像度推定処理を示すフローチャート。
【図6】 図4の画像処理装置による距離推定処理の説明図。
【図7】 本発明としての第3の実施の形態を適用した画像処理装置の要部ブロック構成図。
【図8】 図7の画像処理装置による解像度推定処理を示すフローチャート。
【図9】 本発明の画像処理装置を適用したデジタルカメラの要部ブロック構成図。
【図10】 図9のデジタルカメラによる解像度推定処理の説明図。
【符号の説明】
画像処理装置
2 入力部
3 文字サイズ推定部
4 解像度推定部
5 出力部
10 コンピュータ
11 入力I/F
12 CPU
13 ドライブ
14 メモリ
15 出力I/F
16 ネットワークコントローラ
17 バス
20 記録媒体
30 画像処理装置
31 距離推定部
40 画像処理装置
41 文字サイズ・距離推定部
42 文字サイズ推定部
43 距離推定部
50 デジタルカメラ
51 入力I/F
52 CPU
53 メモリ
54 ドライブ
55 ネットワークコントローラ
56 出力I/F
60 記録媒体
71 被写体
72 画像ファイル
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, an image processing method, and a program , and more specifically, an image processing apparatus capable of calculating the resolution of a document image captured from a scanner, a digital camera, or the like to improve character recognition accuracy, and an image The present invention relates to a processing method and a program .
[0002]
[Prior art]
In recent years, as the processing power of personal computers has dramatically improved and image data can be easily manipulated, a lot of image data is used in document creation in offices, and image data is very important. It has become a thing.
[0003]
Under such circumstances, there is an increasing demand for easily capturing a document at hand as an image and performing character recognition (OCR). To obtain image data, there is a method of recognizing characters by inputting a document image with a digital camera or a scanner.
[0004]
As a conventional technique for photographing a document image with a digital camera, for example, a photographing means for photographing a subject, a detecting means for detecting a distance to the subject at the time of photographing by the photographing means, and a detection means. A determination means for determining the size of the subject based on a distance to the subject and a size of a photographed image of the subject photographed by the photographing means; and a size of the subject determined by the determination means. Accordingly, there has been proposed a photographic image processing apparatus including correction output means for correcting the size of a photographic image taken by the photographic means and outputting the corrected photographic image (Japanese Patent Laid-Open No. 2001-14453). reference).
[0005]
That is, for example, when a standard format is created by a word processor, this conventional technique automatically corrects an image corresponding to the size of the standard format by photographing a document of the standard format with a digital camera. The actual size image data is acquired from the image.
[0006]
Conventionally, there has been proposed a digital camera that increases the resolution of a digital image taken with a digital camera and incorporates an OCR (character recognition) device to perform high resolution processing to increase the recognition rate (Japanese Patent Laid-Open No. 9-289624). No. publication).
[0007]
In other words, this conventional technique increases the resolution (pixel density conversion) of an image taken with a digital camera to improve the character recognition rate.
[0008]
[Problems to be solved by the invention]
However, in the technique described in the conventional publication, it is necessary to improve the character recognition rate.
[0009]
That is, in character recognition (OCR), resolution information is often required to adapt to an image.
[0010]
However, the conventional technology described in Japanese Patent Application Laid-Open No. 2001-14453 obtains actual size image data from a captured image, but the resolution is unknown, which is a problem in improving the character recognition rate.
[0011]
In the prior art described in Japanese Patent Laid-Open No. 9-289624, the resolution of a picture taken with a digital camera is increased (pixel density conversion), but the resolution accuracy such as an error is generated. There was a problem, and there was a need for improvement.
[0012]
SUMMARY An advantage of some aspects of the invention is that it provides an image processing apparatus, an image processing method, and a program for obtaining an accurate resolution of a document image captured by a digital camera or the like and improving the recognition accuracy of character recognition (OCR).
[0013]
[Means for Solving the Problems]
The image processing apparatus according to the first aspect of the present invention provides a means for estimating the resolution (first resolution) of the document image based on the character size of the document image, and the document image based on the distance to the document image. It has means for estimating the resolution (second resolution) and means for setting the average of the estimated first resolution and second resolution as the resolution of the document image.
[0014]
According to the image processing method of the present invention, the document processing apparatus estimates the resolution (first resolution) of the document image based on the character size of the document image, and based on the distance to the document image. And executing the step of estimating the resolution (second resolution) of the document image and setting the average of the estimated first resolution and second resolution as the resolution of the document image. To do.
[0015]
According to a third aspect of the present invention, there is provided a program for estimating a resolution (first resolution) of a document image based on a character size of the document image, and a resolution of the document image based on a distance to the document image ( (2nd resolution) and a program for causing a computer to execute a step of setting an average of the estimated first resolution and second resolution as the resolution of the document image. To do.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described in detail with reference to the accompanying drawings. The embodiments described below are preferred embodiments of the present invention, and thus various technically preferable limitations are given. However, the scope of the present invention is particularly limited in the following description. As long as there is no description which limits, it is not restricted to these aspects.
[0017]
1 to 3 are diagrams for explaining a first embodiment as a premise of the present invention. FIG. 1 is a block diagram of a main part of an image processing apparatus 1 to which the first embodiment is applied. is there.
[0018]
In FIG. 1, the image processing apparatus 1 includes an input unit 2, a character size estimation unit 3, a resolution estimation unit 4, an output unit 5, and the like.
[0019]
The input unit (input unit) 2 inputs a document image, and takes in a document image obtained by photographing a subject from a silver salt photograph or a lens of a digital camera, or takes a photograph image as document image data using a scanner. , Output to the character size estimation unit 3.
[0020]
The character size estimation unit (character size estimation means) 3 extracts characters from the document image input from the input unit 2, estimates the character size, and outputs the estimated character size to the resolution estimation unit 4. The character size estimation unit 3 checks whether the data input from the input unit 2 is a document image, extracts characters only when the data is a document image, and estimates the character size.
[0021]
The resolution estimation unit (resolution estimation unit) 4 estimates the resolution based on the character size estimated by the character size estimation unit 3.
[0022]
The output unit 5 outputs display display, printout, audio, and the like, and outputs an image based on the resolution estimated by the resolution estimation unit 4.
[0023]
As shown in FIG. 2, the image processing apparatus 1 has a resolution estimation method program (resolution estimation program) recorded in a computer (information processing apparatus) 10 such as a personal computer, such as a CD (Compact Disc) or a DVD ( It is constructed by reading a predetermined recording medium 20 such as a Digital Video Disk).
[0024]
That is, the computer 10 generally includes an input I / F 11, a CPU (Central Processing Unit) 12, a drive 13, a memory 14, an output I / F 15, a network controller 16 and the like, as shown in FIG. Main parts are connected to the bus 17. The computer 10 is constructed as the image processing apparatus 1 by reading and introducing the recording medium 20 recorded with the resolution estimation program such as CD or DVD into the drive 13.
[0025]
The memory 14 uses, for example, a large-capacity storage medium such as a hard disk, and stores an OS (Operating System) on which the computer 10 operates, a necessary program, and a resolution estimation program introduced from the recording medium 20.
[0026]
The CPU 12 executes various programs on the OS in the memory 14, in particular, a resolution estimation program, and executes resolution estimation processing.
[0027]
The input I / F 11 is used for inputting various data, particularly for inputting document image data.
[0028]
The output I / F 15 is connected to a display, a printer, a speaker, a network, etc.
It is used for outputting various data, particularly for outputting document images.
[0029]
The network controller 16 is used to output data to a network (not shown) to which the computer 10 is connected.
[0030]
Next, the operation of the present embodiment will be described. The image processing apparatus 1 according to the present embodiment is characterized in that the resolution of an input document image is estimated so that character recognition (OCR) can be performed accurately.
[0031]
That is, as shown in FIG. 3, the image processing apparatus 1 first performs an image input process from the input unit 2 (step S101). In this image input processing, a silver halide photograph or a document image obtained by photographing a subject from a lens of a digital camera is captured, or a photographic image is captured as document image data using a scanner.
[0032]
When the image processing apparatus 1 captures the data, the image processing apparatus 1 checks whether the captured data is a document image (step S102). If the data is not a document image, the image processing apparatus 1 outputs the data as it is from the output unit 5 and ends the processing (step S102). Step S105). In the determination of whether or not this data is a document image and character extraction, a function used in a generally known character recognition (OCR) process can be used.
[0033]
If the captured data is a document image in step S102, the character size estimation unit 3 estimates the character size and outputs it to the resolution estimation unit 4 (step S103), and the resolution estimation unit 4 estimates the resolution (step S103). S104).
[0034]
In order to estimate the character size from the input document image, the following method can be used.
[0035]
That is, when the estimated character size (pixel) is v, a predetermined constant (dpi / pixel) is N, and the estimated resolution (dpi) is R1, the character size (pixel) v is obtained. The image is binarized to obtain a connected portion, and a horizontal / vertical size histogram is obtained to obtain a value giving the maximum frequency. N is a constant, which is determined for each image processing apparatus 1.
[0036]
The estimated resolution R1 is obtained as follows using the character size v obtained in step S103.
[0037]
For example, when N = 200/64 (dpi / pixel) and the character size v is v = 32 (pixel), the estimated resolution R1 is R1 = 200/64 × 32, R1 = 100 (dpi) It becomes.
[0038]
Thereafter, the image processing apparatus 1 outputs the resolution information to the output unit 5 for display display, printout, audio, or the like, or is incorporated into the additional information part of the image to output the display display, printout, audio, etc. 5 to finish the process (step S105).
[0039]
As described above, the image processing apparatus 1 according to the present embodiment starts from the document image input from the input unit 2.
The character size estimation unit 3 estimates the character size of the document image, and the resolution can be calculated easily and accurately based on the estimated character size based on the character size of the document image. Accuracy can be improved.
[0040]
4 to 6 are diagrams for explaining a second embodiment as a premise of the present invention, and FIG. 4 is a block diagram of a main part of an image processing apparatus 30 to which the second embodiment is applied. It is.
[0041]
In the description of the present embodiment, the same components as those of the image processing apparatus 1 of the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
[0042]
In FIG. 4, the image processing device 30 includes an input unit 2, a resolution estimation unit 4, and an output unit 5 similar to those of the image processing device 1 of the first embodiment, and also includes a distance estimation unit 31. The character size estimation unit 3 of the image processing apparatus 1 according to the first embodiment is not provided.
[0043]
The distance estimation unit (distance estimation unit) 31 estimates the distance from the input unit 2 to the document image and outputs the estimated distance to the resolution estimation unit 4.
[0044]
The resolution estimation unit 4 estimates the resolution of the image based on the estimated distance.
[0045]
As shown in FIG. 5, the image processing apparatus 30 according to the present embodiment first performs an image input process from the input unit 2 (step S201). In this image input processing, as in the case of the first embodiment, a document image obtained by photographing a subject from a silver halide photograph or a lens of a digital camera is captured, or a photographic image is captured as document image data using a scanner. .
[0046]
When the image processing apparatus 30 captures the data, the image processing apparatus 30 checks whether the captured data is a document image (step S202). If the data is not a document image, the image processing apparatus 30 outputs the data as it is from the output unit 5 and ends the processing (step S202). Step S205). In the determination of whether or not this data is a document image and character extraction, a function used in a generally known character recognition (OCR) process can be used as described above.
[0047]
If the captured data is a document image in step S202, the distance estimation unit 31 estimates the distance from the input unit 2 to the document image, and outputs it to the resolution estimation unit 4 (step S203). Estimates the resolution (step S204).
[0048]
In order to estimate the resolution from the input document image, the following method can be used.
[0049]
That is, as shown in FIG. 6, the estimated distance (m) to the document image that is the input image is l, the predetermined constant (dpi / pixel) is C, the estimated resolution (dpi) is R2 When the distance (m) l is obtained by actually measuring the distance to the input image, and the resolution at the distance r to the virtual image is 200 dpi, r: 200 (dpi) = 1 (m): R2 (dpi), R2 = (200 / r) × l.
[0050]
At this time, 200 / r is a constant C. This constant C is determined for each resolution estimation device 30.
[0051]
The image processing apparatus 30 then outputs the resolution information to the output unit 5 for display display, printout, audio, or the like, or is incorporated into the additional information portion of the image and output unit for display display, printout, audio, etc. 5 to finish the processing (step S205).
[0052]
As described above, the image processing apparatus 30 according to the present embodiment estimates the distance from the document image input from the input unit 2 to the document image by the distance estimation unit 31, and estimates the resolution based on the estimated distance. Part 4 estimates the resolution of the document image.
[0053]
Therefore, the resolution can be calculated easily and accurately based on the distance to the document image, and the character recognition accuracy of the document image can be improved.
[0054]
FIGS. 7 and 8 are diagrams for explaining a third embodiment of the present invention. FIG. 7 is a block diagram of a main part of an image processing apparatus 40 to which the third embodiment is applied. .
[0055]
This embodiment is a combination of the first embodiment and the second embodiment. Also in the description of the present embodiment , the same components as those of the image processing apparatus 1 of the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
[0056]
In FIG. 7, an image processing device 40 includes an input unit 2, a resolution estimation unit 4, and an output unit 5 similar to the resolution estimation device 1 of the first embodiment, and a character size / distance estimation unit 41. It has.
[0057]
The character size / distance estimation unit 41 includes a character size estimation unit 42 and a distance estimation unit 43.
[0058]
The character size estimation unit (character size estimation means) 42 extracts characters from the document image input from the input unit 2 and estimates the character size in the same manner as the character size estimation unit 3 of the first embodiment. And output to the resolution estimation unit 4. The character size estimation unit 42 checks whether the data input from the input unit 2 is a document image, extracts a character only when the data is a document image, and estimates the character size.
[0059]
The distance estimation unit (distance estimation unit) 43 estimates the distance from the input unit 2 to the document image, and outputs the estimated distance to the resolution estimation unit 4, similarly to the distance estimation unit 31 of the second embodiment.
[0060]
As shown in FIG. 8, the image processing apparatus 40 according to the present embodiment first performs image input processing from the input unit 2 (step S301). In this image input processing, as in the case of the first embodiment, a document image obtained by photographing a subject from a silver halide photograph or a lens of a digital camera is captured, or a photographic image is captured as document image data using a scanner. .
[0061]
When the image processing apparatus 40 captures the data, the image processing apparatus 40 checks whether the captured data is a document image (step S302). If the data is not a document image, the image processing apparatus 40 outputs the data as it is and ends the processing (step S306). In the determination of whether or not this data is a document image and character extraction, a function used in a generally known character recognition (OCR) process can be used as described above.
[0062]
If the captured data is a document image in step S302, first, the character size estimation unit 42 of the character size / distance estimation unit 41 performs a character size estimation process as in the case of the first embodiment. The character size is estimated and output to the resolution estimator 4 (step S303). Next, the distance estimator 43 performs the distance estimation process as in the case of the second embodiment, and inputs it. The distance from the unit 2 to the document image is estimated and output to the resolution estimation unit 4 (step S304). Then, the resolution estimation unit 4 estimates the resolution based on the character size and distance (step S305). At this time, the resolution estimation unit 4 calculates the resolution R1 from the character size in step S303 as in the case of the first embodiment, and the second embodiment from the distance in step S304. As in the case of, the resolution R2 is calculated, and the final resolution R3 is calculated as follows using these two resolutions R1 and R2.
R3 = (R1 + R2) / 2
[0063]
The image processing apparatus 40 then outputs the resolution information to the output unit 5 for display display, printout, audio, or the like, or is incorporated into the additional information portion of the image and output unit for display display, printout, audio, etc. 5 to finish the process (step S306).
[0064]
As described above, the image processing apparatus 40 according to the present embodiment estimates the character size of the document image from the document image input from the input unit 2 by the character size estimation unit 42 of the character size / distance estimation unit 41. The distance to the document image is estimated by the distance estimating unit 43 of the character size / distance estimating unit 41, and the resolution of the document image is estimated by the resolution estimating unit 4 based on the estimated character size and distance. .
[0065]
Therefore, the resolution can be calculated easily and more accurately based on the character size of the document image and the distance to the document image, and the character recognition accuracy of the document image can be further improved.
[0066]
FIG. 9 is a block diagram of a main part of a digital camera 50 to which the image processing apparatus according to the embodiment of the present invention is applied.
[0067]
In FIG. 9, the digital camera 50 includes an input I / F 51, a CPU 52, a memory 53, a drive 54, a network controller 55, an output I / F 56, and the like.
[0068]
The drive 54 is a large-capacity storage medium serving as a main storage, and the digital camera is read by introducing a recording medium 60 recorded with a resolution estimation program such as a CD or a DVD into the large-capacity storage medium. 50 can be constructed as a digital camera incorporating an image processing device .
[0069]
The input I / F 51 is an interface for inputting an image. The CPU 52 controls each part of the digital camera 50 based on a program of the drive 54 to operate as the digital camera 50 and is installed in the drive 54. The resolution estimation process is executed by the resolution estimation program.
[0070]
The memory 53 is an auxiliary storage medium for storing image data and the like, and the network controller 55 is connected to the network and exchanges data with devices on the network. The output I / F 56 is an interface for outputting image data.
[0071]
In the present embodiment, as shown in FIG. 10, the digital camera 50 is set so that the subject 71 is automatically photographed in the sentence image mode.
[0072]
The digital camera 50 measures the distance to the subject 71 and extracts the contour of the subject 71 and the like. For this contour extraction, a generally known contour extraction algorithm such as character recognition (OCR) is used.
[0073]
Next, in the digital camera 50, the CPU 52 calculates the resolution using the storage medium of the memory 53 and the drive 54, and outputs the estimated value of the calculated resolution as an image file 72 from the output I / F 56.
[0074]
As described above, the digital camera 50 according to the present embodiment implements a function as an image processing apparatus that executes a resolution estimation process by installing a resolution estimation program in the digital camera 50 capable of capturing a document image. .
[0075]
Therefore, a document image can be photographed with the digital camera 50, and the resolution of the photographed document image can be calculated easily and accurately, and the character recognition accuracy of the document image can be improved.
[0076]
In each of the above embodiments, a resolution estimation program for estimating the resolution of the input image is recorded in the recording media 20 and 60, and the resolution estimation program for the recording media 20 and 60 is stored in an information processing apparatus such as the computer 10 or the like. By mounting on the digital camera 50, the digital camera 50 that executes resolution estimation processing is constructed.
[0077]
Therefore, it is possible to easily construct the image processing apparatus and the digital camera 50 that executes the resolution estimation method for calculating the resolution of the document image easily and accurately and further improving the character recognition accuracy of the document image.
[0078]
The invention made by the present inventor has been specifically described based on the preferred embodiments. However, the present invention is not limited to the above, and various modifications can be made without departing from the scope of the invention. Needless to say.
[0079]
【The invention's effect】
According to the present invention, the resolution of a document image can be calculated easily and more accurately based on the character size of the document image and the distance to the document image, and the character recognition accuracy of the document image can be further improved. Can do.
[Brief description of the drawings]
FIG. 1 is a block diagram of a main part of an image processing apparatus to which a first embodiment of the present invention is applied .
FIG. 2 is a block diagram of a main part of a computer to which the image processing apparatus of FIG. 1 is applied.
FIG. 3 is a flowchart showing resolution estimation processing by the image processing apparatus of FIG. 1;
FIG. 4 is a block diagram of a main part of an image processing apparatus to which a second embodiment on the premise of the present invention is applied .
FIG. 5 is a flowchart showing resolution estimation processing by the image processing apparatus of FIG. 4;
6 is an explanatory diagram of distance estimation processing by the image processing apparatus of FIG. 4;
FIG. 7 is a block diagram of a main part of an image processing apparatus to which a third embodiment of the present invention is applied .
8 is a flowchart showing resolution estimation processing by the image processing apparatus in FIG. 7;
FIG. 9 is a block diagram of the main part of a digital camera to which the image processing apparatus of the present invention is applied.
10 is an explanatory diagram of resolution estimation processing by the digital camera of FIG. 9;
[Explanation of symbols]
1 image processing device 2 input unit 3 character size estimation unit 4 resolution estimation unit 5 output unit 10 computer 11 input I / F
12 CPU
13 Drive 14 Memory 15 Output I / F
16 Network controller 17 Bus 20 Recording medium 30 Image processing device 31 Distance estimation unit 40 Image processing device 41 Character size / distance estimation unit 42 Character size estimation unit 43 Distance estimation unit 50 Digital camera 51 Input I / F
52 CPU
53 Memory 54 Drive 55 Network controller 56 Output I / F
60 Recording medium 71 Subject 72 Image file

Claims (3)

文書画像の文字サイズに基づいて当該文書画像の解像度(以下、第1の解像度)を推定する手段と、Means for estimating the resolution of the document image (hereinafter, first resolution) based on the character size of the document image;
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定する手段と、Means for estimating a resolution of the document image (hereinafter, second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とする手段と、Means for taking the average of the estimated first resolution and second resolution as the resolution of the document image;
を有することを特徴とする画像処理装置。An image processing apparatus comprising:
文書処理装置が、The document processing device
文書画像の文字サイズに基づいて当該文書画像の解像度(以下、第1の解像度)を推定するステップと、Estimating the resolution of the document image (hereinafter, first resolution) based on the character size of the document image;
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定するステップと、Estimating a resolution of the document image (hereinafter referred to as a second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップと、Taking the average of the estimated first resolution and second resolution as the resolution of the document image;
を実行することを特徴とする画像処方法。The image processing method characterized by performing.
文書画像の文字サイズに基づいて当該文書画像の解像度(以下、第1の解像度)を推定するステップと、Estimating the resolution of the document image (hereinafter, first resolution) based on the character size of the document image;
前記文書画像までの距離に基づいて当該文書画像の解像度(以下、第2の解像度)を推定するステップと、Estimating a resolution of the document image (hereinafter referred to as a second resolution) based on a distance to the document image;
前記推定された第1の解像度及び第2の解像度の平均を前記文書画像の解像度とするステップと、Taking the average of the estimated first resolution and second resolution as the resolution of the document image;
をコンピュータに実行させるためのプログラム。A program that causes a computer to execute.
JP2002218180A 2002-07-26 2002-07-26 Image processing apparatus, image processing method, and program Expired - Fee Related JP4140885B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002218180A JP4140885B2 (en) 2002-07-26 2002-07-26 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002218180A JP4140885B2 (en) 2002-07-26 2002-07-26 Image processing apparatus, image processing method, and program

Publications (2)

Publication Number Publication Date
JP2004062400A JP2004062400A (en) 2004-02-26
JP4140885B2 true JP4140885B2 (en) 2008-08-27

Family

ID=31939443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002218180A Expired - Fee Related JP4140885B2 (en) 2002-07-26 2002-07-26 Image processing apparatus, image processing method, and program

Country Status (1)

Country Link
JP (1) JP4140885B2 (en)

Also Published As

Publication number Publication date
JP2004062400A (en) 2004-02-26

Similar Documents

Publication Publication Date Title
JP2009064421A (en) Method for encoding depth data, depth map creation device, and electronic device
US8441554B2 (en) Image capturing apparatus capable of extracting subject region from captured image
WO2012075817A1 (en) Text image trimming method
JP2003234888A (en) Image correction device, program, storage medium, and method for correcting image
US8588550B2 (en) Virtual level for a digital camera
US7319778B2 (en) Image processing apparatus
JP4200419B2 (en) PHOTO EXTRACTION METHOD, DEVICE, PROGRAM, AND RECORDING MEDIUM
JP4894708B2 (en) Imaging device
CN101631251B (en) Image processing apparatus and method thereof
JP4145014B2 (en) Image processing device
JP5111255B2 (en) Image processing apparatus, image processing method, computer program, and recording medium
JP2004185386A (en) Image collating unit
JP4140885B2 (en) Image processing apparatus, image processing method, and program
JP5365327B2 (en) Subject tracking device and camera
US8131101B2 (en) Image processing method and image processing apparatus
JP5029647B2 (en) Subject tracking device and camera
JP2012095231A (en) Form image management system, form image management method, and program
JP3881455B2 (en) Image correction apparatus, image correction method, and medium on which image correction method is recorded
JP2006268493A (en) Image processor, image processing method program and recording medium
JPH11220683A (en) Image processor and method therefor and storage medium
JP5336798B2 (en) Image processing apparatus, image processing method, and program
JP2010074312A (en) Image processing apparatus and method, and program
JP2003189082A (en) Image distortion correcting apparatus, program, storage medium thereof and method therefor
JP6922690B2 (en) Character area extraction program, character area extraction device and character area extraction method
JP4235519B2 (en) Image forming system, image forming apparatus, control method therefor, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050223

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080604

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080606

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees