JP2007180872A - 画像処理装置、撮像装置、画像処理方法及びプログラム - Google Patents

画像処理装置、撮像装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP2007180872A
JP2007180872A JP2005376666A JP2005376666A JP2007180872A JP 2007180872 A JP2007180872 A JP 2007180872A JP 2005376666 A JP2005376666 A JP 2005376666A JP 2005376666 A JP2005376666 A JP 2005376666A JP 2007180872 A JP2007180872 A JP 2007180872A
Authority
JP
Japan
Prior art keywords
image
document
image processing
postcard
photographing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005376666A
Other languages
English (en)
Other versions
JP4591343B2 (ja
Inventor
Yoshihiro Tejima
義裕 手島
Keiichi Sakurai
敬一 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2005376666A priority Critical patent/JP4591343B2/ja
Publication of JP2007180872A publication Critical patent/JP2007180872A/ja
Application granted granted Critical
Publication of JP4591343B2 publication Critical patent/JP4591343B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)

Abstract

【課題】葉書の表裏面を撮影して管理しやすいようにデータ化する。
【解決手段】デジタルカメラ1は、シャッターが押下されて葉書2の表裏を撮影する。デジタルカメラ1は、葉書2の画像の輪郭を検出し、操作者の指示により、斜め撮影補正を行う。そして、デジタルカメラ1は、切手や料金に関する記載が行われる領域を判別することにより、この葉書2が縦書又は横書に使用されているかを判別する。デジタルカメラ1は、この判別結果に基づいて、葉書2の表裏の画像を合成する。
【選択図】図1

Description

本発明は、画像処理装置、撮像装置、画像処理方法及びプログラムに関するものである。
近年、データの管理上デジタルでデータ化した方が検索も管理も容易であるため、様々な文書のデータ化が進んでいる。一般家庭等に存在する葉書等も例外ではない。この葉書のデータ化には、フラットベッドスキャナを用いるのが一般的である(例えば、特許文献1参照)。
特開平10−294854号公報(第4頁、図1)
しかし、このフラットベッドスキャナは、近年、撮影用として普及しているデジタルカメラと比較して、まだ、一般用途向きではなく、その普及率は低い。
そこで、このデジタルカメラを使用して葉書をデータ化することも考えられるものの、デジタルカメラを使用した場合、葉書の画像が歪んだり、葉書の表裏面の画像を個別に管理しなければならず、葉書のデータ化にデジタルカメラを用いることには、まだ、多くの問題がある。
本発明は、このような従来の問題点に鑑みてなされたもので、文書の表裏面を撮影して管理しやすいようにデータ化することが可能な画像処理装置、撮像装置、画像処理方法及びプログラムを提供することを目的とする。
この目的を達成するため、本発明の第1の観点に係る画像処理装置は、
撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正部と、
前記撮影画像補正部によって補正された表面画像と裏面画像とを合成する画像合成部と、を備えたことを特徴とする。
前記文書は、表面又は裏面に文字が記載されるとともに、予め表面の設定された領域に予め設定された識別印が記載された定型文書であって、
前記撮影画像補正部は、形状を補正した画像に基づいて、前記定型文書に記載された文字を認識し、文字認識率に基づいて前記定型文書の向きを判別し、判別結果に基づいて前記定型文書の画像の向きを整えて予め前記表面の設定された領域を判別し、判別した領域に前記識別印を検出したときは、前記撮影によって得られた撮影画像が前記定型文書の表面画像と判定し、前記判別した領域に前記識別印が検出されなかったときは、前記撮影画像が前記定型文書の裏面画像と判定し、
前記画像合成部は、前記撮影画像補正部が判定した前記定型文書の前記表面画像と前記裏面画像とを合成するようにしてもよい。
前記撮影画像補正部は、前記文書の表面画像と裏面画像とから、それぞれ、2値エッジ画像を取得し、取得した2値エッジ画像の輪郭を取得し、取得した輪郭から、画像の頂点座標を取得し、取得した頂点座標を用いて、前記画像の形状を前記文書に対応する形状に射影変換することにより、それぞれの画像の形状を前記文書に対応する形状に補正するようにしてもよい。
本発明の第2の観点に係る撮像装置は、
文書の表面と裏面とをそれぞれ撮影する撮影部と、
前記撮影部の撮影によって得られた文書の画像に対して画像処理を行う画像処理部と、を備え、
前記画像処理部は、
前記撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正部と、
前記撮影画像補正部によって補正された表面画像と裏面画像とを合成する画像合成部と、を備えたことを特徴とする。
本発明の第3の観点に係る画像処理方法は、
撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正ステップと、
前記補正された表面画像と裏面画像とを合成する画像合成ステップと、を備えたことを特徴とする。
前記文書は、表面又は裏面に文字が記載されるとともに、予め表面の設定された領域に予め設定された識別印が記載された定型文書であって、
前記撮影画像補正ステップは、形状を補正した画像に基づいて、前記定型文書に記載された文字を認識し、文字認識率に基づいて前記定型文書の向きを判別し、判別結果に基づいて前記定型文書の画像の向きを整えて予め前記表面の設定された領域を判別し、判別した領域に前記識別印を検出したときは、前記撮影によって得られた撮影画像が前記定型文書の表面画像と判定し、前記判別した領域に前記識別印が検出されなかったときは、前記撮影画像が前記定型文書の裏面画像と判定するステップであってもよい。
本発明の第3の観点に係るプログラムは、
コンピュータに、
撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する手順、
前記補正された表面画像と裏面画像とを合成する手順、
を実行させるためのものである。
本発明によれば、文書の表面画像と裏面画像とを撮影して管理しやすいようにデータ化することができる。
以下、本発明の実施形態に係る撮像装置を図面を参照して説明する。尚、本実施形態では、撮像装置をデジタルカメラとして説明する。
本実施形態に係るデジタルカメラ1の構成を図1に示す。
本実施形態に係るデジタルカメラ1は、図1に示すように、葉書2の表(おもて)面、裏面を撮影する。この葉書2は定型文書である。即ち、葉書2は、長辺と短辺との矩形の形状を有し、葉書2の表面の予め設定された領域に、識別印としての切手や料金に関する記載がある。
この記載として、局では直径20〜30mmの円形又は縦横それぞれ20〜30mmの四角形のスタンプが押印される。
この葉書2は、縦書きで使用される場合と横書きで使用される場合とがある。切手や料金に関する記載の領域は、予め設定されており、縦書きで使用される場合、この領域は、葉書2の左上に存在し、横書きで使用される場合、この領域は、葉書2の右上に存在する。
本実施形態に係るデジタルカメラ1は、このような葉書2の撮影画像から、表面、裏面の輪郭を取得し、葉書2の両画像に対してそれぞれ斜め撮影補正を行い、葉書2の表裏の画像を1つの画像に合成して保存するように構成されている。
デジタルカメラ1は、このような処理を行うことにより、スキャナもコンピュータも用いることなく葉書2の内容をデータ化する。かかるデジタルカメラ1は、図2に示すように、画像データ生成部10と、データ処理部20と、ユーザインタフェース部30と、からなる。
画像データ生成部10は、光学レンズ装置11と、イメージセンサ12と、から構成され、葉書2を撮影して、葉書2の内容をデジタルデータ化するものである。
このデジタルカメラ1は、高解像度画像撮影と低解像度画像撮影(プレビュー撮影)が可能なものである。低解像度画像撮影は、画像解像度がXGA(1024×768ドット)程度で解像度は低いものの、画像を30fps(フレーム/秒)の速さで動画撮影と画像読み出しが可能となる撮影である。
高解像度画像撮影は、例えば、撮影可能な最大画素数、例えば、デジタルカメラ1が400万画素のカメラである場合、その400万画素の解像度で画像撮影行う撮影である。画像データ生成部10は、高解像度画像撮影、低解像度画像撮影を行う。
光学レンズ装置11は、葉書2を撮影するために、光を集光するレンズなどで構成されたものであり、焦点、露出、ホワイトバランス等のカメラ設定パラメータを調整するための周辺回路を備える。
イメージセンサ12は、光学レンズ装置11が光を集光することによって結像した画像を、デジタル化した画像データとして取り込むためのものであり、CCD(Charge Coupled Device;電荷結合素子)等によって構成される。
ユーザインタフェース部30は、表示部31と、操作部32と、PCインタフェース装置33と、外部記憶部34と、からなる。
表示部31は、画像を表示するためのものであり、液晶モニタ等を備える。表示部31は、データ処理部20のメモリ21から、画像データを読み出して、葉書2のプレビュー画像、2値エッジ画像、葉書2の画像から取得した葉書2の輪郭等を表示する。
操作部32は、操作者の操作情報を取得するためのものであり、デジタルカメラ1の機能を制御するためのスイッチ、キーとして、電源スイッチと、シャッターと、補正キーと、カーソルキーと、決定キーと、を備える(図示せず)。
電源スイッチは、デジタルカメラ1の電源をオン(ON)、オフ(OFF)するためのものである。
シャッターは、撮影時に押下するスイッチである。補正キーは、葉書2の画像に対する斜め撮影補正を指示するためのキーである。
カーソルキーは、写真、メニュー等の選択を行うためのキーであり、合成された葉書2の向きの修正を指示する場合に、この向きを選択するキーとしても用いられる。決定キーは、選択した指示を決定させるためのキーである。
操作部32は、操作者がこれらのスイッチ、キーを操作すると、この操作情報をデータ処理部20のCPU25に供給する。
PCインタフェース装置33は、画像データ等を、USB(Universal Serial Bus)規格のデータに変換し、USBケーブル等を介してコンピュータ(図示せず)に送信するとともに、コンピュータからのデータ、信号を受信するためのものである。
外部記憶部34は、合成された葉書2の画像を保存するためのものである。
データ処理部20は、画像データ生成部10から、画像データを取得して、プロジェクタ4に出力するための画像の処理を行うものである。データ処理部20は、メモリ21と、ビデオ出力装置22と、画像処理装置23と、プログラムコード記憶装置24と、CPU25と、から構成される。
メモリ21は、画像データ、各種閾値等を記憶するものである。メモリ21は、これらのデータが書き込まれる領域として、図3に示すように、センサ画像記憶領域21aと、処理画像記憶領域21bと、表示画像記憶領域21cと、作業データ記憶領域21dと、閾値記憶領域21eと、を有する。
センサ画像記憶領域21aは、イメージセンサ12が取り込んだ画像データを、撮影する毎に一時記憶するための領域である。イメージセンサ12は、画像データをセンサ画像記憶領域21aに記憶する。
処理画像記憶領域21bは、画像処理装置23の処理に必要な画像データを記憶するための領域である。表示画像記憶領域21cは、表示用の出力画像の画像を記憶するための領域である。作業データ記憶領域21dは、座標データ等を記憶するための領域である。閾値記憶領域21eは、各種判定に用いる閾値を記憶するための領域である。
図2に戻り、ビデオ出力装置22は、CPU25に制御され、メモリ21の表示画像記憶領域21cに記憶された画像データに基づいてRGB信号を生成するものである。ビデオ出力装置22は、ビデオ映像ケーブルを介してプロジェクタ(図示せず)に接続されると、生成したRGB信号をプロジェクタに出力する。尚、ビデオ出力装置22は、RGB信号をコンピュータに送り出すように構成されてもよい。
画像処理装置23は、CPU25に制御されて、画像データに対して画像処理を行うためのものである。画像処理装置23は、デジタルカメラ1の機能を実現するため、以下の画像処理を行う。
(1)輪郭取得処理
(2)斜め撮影補正処理
(3)表裏及び上下検出処理
(4)画像合成処理
以下、(1)〜(4)の処理について説明する。
(1)輪郭取得処理
輪郭取得処理は、葉書2の画像の輪郭を取得する処理である。葉書2の画像の輪郭を取得するため、画像処理装置23は、まず、図4(a)に示すような葉書2のプレビュー画像から、エッジの検出を行い、図4(b)に示すような2値エッジ画像を作成する。
画像処理装置23は、このように生成した二値化画像から、例えば、Robertsフィルタと呼ばれるエッジ検出用のフィルタを用いる。このRobertsフィルタとは、2つの4近傍ピクセルの重み付けを行って2つのフィルタΔ1、Δ2を取得し、平均化することによって、画像のエッジを検出するフィルタである。
ある着目した座標(x,y)の画素値f(x,y)にRobertsフィルタを適用すると、変換後の画素値g(x,y)は、次の数1によって表される。
Figure 2007180872
画像処理装置23は、このようにして得られた画素値g(x,y)を予め設定された閾値を用いて2値化する。閾値は、固定的に設定されてもよいし、可変閾値方等の方法で求められたものであってもよい。この閾値は、メモリ21の閾値記憶領域21eに予め記憶される。
画像処理装置23は、数1に従って求めたエッジ画像g(x,y)に、次の数2の演算を施すことにより、エッジ2値画像h(x,y)を取得する。
Figure 2007180872
画像処理装置23は、生成したエッジ画像に対して、ハフ変換を行い、葉書2の輪郭を形成する直線を検出する。
ハフ変換とは、図5(a)に示すようなX−Y平面上の直線を構成する点を、次の数3によって表される図5(b)に示すようなρ-θ平面上に投票して、ρ-θ平面上の投票数に変換する変換手法である。
Figure 2007180872
各点の座標(x、y)において角度θを0から360°まで変化させた場合、同一直線はρ-θ平面では一点で表される。このため、投票数の多いρ-θ座標を直線と判断することができる。この際、投票数は、直線上のピクセル数になるため、直線の長さとみなすことができる。したがって、投票数の極端に少ないρ-θ座標は、短い直線を表し、直線の候補から除外される。
調査対象であるエッジ画像において画像中心を原点とした座標系で考えると、ρはマイナスの値も取ることになるため、角度θを0°≦θ<180°の範囲で測定すれば、ρは残りの−180°≦θ<0°の範囲で負になる。
しかし、撮影対象の中心が画像の中心近辺に位置する場合、実際に撮影される撮影対象(四角形)の各辺は、上下左右に存在することになる。この場合、ρ-θ平面上の投票数を0°≦θ<180°の範囲で調査するよりは、以下の数4で表される範囲で測定した方が、より効率的である。
Figure 2007180872
調査角度の制限とρの値が正の値か負の値かによって、辺の上下、または辺の左右を特定することが可能である。
その際、ρの絶対値は中心からの距離である。投票数の多い直線候補の中から一番中心からの距離ρの絶対値が大きいものが葉書2の画像の輪郭といえる。但し、交点つまり頂点は画像内のみに存在するものとする。
(2)斜め撮影補正処理
斜め撮影補正処理は、画像の切り抜きと射影補正等を行う処理である。切り抜き処理は、抽出した四角形の輪郭に基づいて、撮影画像から葉書2の表面画像と裏面画像を切り抜く処理である。通常、切り抜いた葉書2の画像は歪んだものになる。
射影補正処理は、切り取った葉書2の画像を射影変換して、画像の歪みを補正する処理である。画像処理装置23は、この歪みを補正するため、画像の空間変換に幅広く応用されているアフィン変換を用いる。
画像処理装置23は、葉書2等の画像から抽出した輪郭(4つの頂点)から、射影補正画像とのアフィン変換の関係を示すアフィンパラメータAを算出し、この変換Aを用いて、求める射影補正画像の各画素P(u,v)に対応する元画像の画素点p(x,y)を求める。
次に、このアフィン変換についての基本的な考え方(実現方法)を説明する。
画像の空間変換にアフィン変換が幅広く応用されている。本実施形態では、3次元のカメラパラメータを用いずに2次元アフィン変換を用いて射影変換を行う。
変換前の座標(u,v)の点は、移動、拡大縮小、回転などの変換が行われることによって変換後の座標(x,y)になる。変換前の座標(u,v)と変換後の座標(x,y)とは、次の数5によって関係付けられる。射影変換もこのアフィン変換により行われる。
Figure 2007180872
最終的な座標(x,y)は、次の数6によって算出される。
Figure 2007180872
数6は、射影変換するための式であり、座標(x,y)は、z'の値に従い、0に向かって縮退する。即ち、z'に含まれるパラメータが射影に影響を及ぼすことになる。このパラメータはa13,a23,a33である。また、他のパラメータは、パラメータa33で正規化されることができるので、a33を1としてもよい。
図6は、カメラ部11が四角形の撮影対象(葉書2)を撮影した場合、撮影画像上の四角形と実際の撮影対象の形状との関係について説明するための図である。図中に各頂点の座標を示す。
図6において、U−V−W座標系は、デジタルカメラ1が撮影して得られた画像の3次元座標系である。A(Au,Av,Aw)ベクトルとB(Bu,Bv,Bw)ベクトルとは、3次元座標系U−V−Wにおいて、撮影対象物をベクトルで表したものである。また、S(Su,Sv,Sw)ベクトルは、3次元座標系U−V−Wの原点と撮影対象物との距離を示す。
図6に示す撮影画像の仮想投影スクリーンは、デジタルカメラ1が映し出した画像を、仮想的に示したものである。スクリーン上の座標系を(x,y)とすると、このスクリーン上に投影される画像がデジタルカメラ1が撮影した画像となる。
投影スクリーンは、W軸上から距離fだけ離れて垂直に位置するものとする。撮影対象物上の任意の点P(u,v,w)と原点とを直線で結び、その直線と投影スクリーンと交差する点があるものとして、その交点のX−Y座標をp(x,y)とする。このとき、座標pは、射影変換より次の数7によって表される。
Figure 2007180872
数7より、図6に示すように4つの頂点P0,P1,P2,P3と投影スクリーンへの投影点p0,p1,p2,p3との関係から、次の数8に示す関係が求められる。
Figure 2007180872
このとき、射影係数α、βは次の数9によって表される。
Figure 2007180872
次に、射影変換について説明する。撮影対象上の任意の点P=(x,y)は、S,A,Bベクトルを用いて、次の数10によって表される。
Figure 2007180872
この数10に、数8の関係式を代入すると、座標xとyとは、次の数11によって表される。
Figure 2007180872
この関係を、アフィン変換の式(数5)に当てはめると、座標(x',y',z')は、次の数12によって表される。
Figure 2007180872
この数12にm,nを代入することにより、撮影画像の対応点(x,y)が求められる。対応点(x,y)は、整数値とは限らないので、画像補間法などを用いて画素の値を求めればよい。
上記m,nは、予め補正画像p(u,v)を出力する画像サイズ(0≦u<umax, 0≦v<vmax)を与えて、その画像サイズに合わせて画像を調整する方法により求めることが考えられる。この方法によれば、m,nは次の数13によって表される。
Figure 2007180872
しかし、作成される補正画像の縦横比と撮影対象の縦横比とは一致しない。ここで、補正画像p(u,v)とm、nの値との関係は、数7、8から、次の数14によって表される。
Figure 2007180872
カメラパラメータであるレンズの焦点距離fが既知であれば、数14に従って、縦横比kを求めることができる。従って、補正画像p(u,v)の画像サイズを(0≦u<umax, 0≦v<vmax)であるとすると、次の数15に従ってm、nを求めることにより、撮影対象と同じ縦横比kを得ることができる。
Figure 2007180872
尚、カメラが固定焦点である場合、レンズの焦点距離fの値を、予め得ることができる。ズームレンズ等が存在する場合には、レンズの焦点距離fの値は、レンズのズーム倍率によって変化する。この場合、そのズーム倍率とレンズの焦点距離fとの関係を示すテーブルを予め作成して記憶し、ズーム倍率に基づいて焦点距離fを読み出し、数14,15に従って、射影変換を行う。
斜め撮影補正は、(1)輪郭検出によって算出された4点(x0,y0),(x1,y1),(x2,y2),(x3,y3)を使用して、(2)これらの座標を数9、数12に代入することにより行われ、補正後の座標(m,n)から元画像における座標(x',y')が算出される。
画像サイズは、数13、14、15を利用して仮定した画像サイズに対して数12を用いて演算を行うことにより算出される。
(3)表裏及び上下検出処理
画像処理装置23は、葉書2の表裏及び上限の検出を行う。本実施形態において、画像処理装置23は、文字認識を行うことにより葉書2の上下を検出する。画像処理装置23は、斜め撮影補正後の画像に対して、上下左右方向から文字認識を行い、最も認識率の高い方向が正しい向きとなる。
この認識率として、具体的に、表面には、住所、「〜様」、「〜殿」等、特定の文字があり、予め、操作者によって、葉書2に記載されているこれらの特定の文字の文字数が入力され、デジタルカメラ1は、メモリ21の作業データ記憶領域に記憶される。画像処理装置23は、認識した文字の中に、これらの特定の文字がいくるあるか、その数を判別することにより認識率を求める。
画像処理装置23は、葉書2の上下を検出すると、その上下を認識した上で、葉書2の裏表を検出する。前述のように、葉書2の表面には、切手や料金に関する記載が行われる領域が存在する。画像処理装置23は、この領域の有無を判別することにより、葉書2の表裏の検出を行う。
また、局印は、前述の通り、円の場合、直径が20〜30mmであり、四角形の場合、縦、横が、それぞれ、20〜30mmである。画像処理装置23は、局印が押下される領域を、例えば、35×70mmに設定する。
この領域は、図7(a)に示すように短辺が上の場合は左上、図7(b)に示すように長辺が上の場合には右上に存在する。画像処理装置23は、この領域内に、この条件に当てはまる有効画素があるか否かを、円又は四角形の中心をずらしながら検索する。
但し、画像処理装置23は、ハフ変換の方法を用いて局印を検出するようにしてもよい。この場合、画像処理装置23は、撮影画像から葉書2の領域の斜め撮影補正後の画像に対してハフ変換の方法を用いることにより、局印の矩形を検出する。
また、画像処理装置23は、直線検出のハフ変換の数3の代わりに数16を用いて、局印の円の検出を行う。
Figure 2007180872
ここで、図8に示すように、半径がrであり、中心点がP(xp,yp)である円上に存在する座標上の点を(xi,yi)とする。
図8に示す直交座標上の同一円は3次元空間(xp,yp,r)では、1点で表される。このため、投票数の多い3次元空間上の点(xp,yp,r)と判断することができる。
矩形又は円が画像中の指定領域内に検出された場合、画像処理装置23は、この面を宛名書きのある表面と判定する。
(4)画像合成処理
画像合成処理は、葉書2の表裏の2枚の画像を合成する処理である。画像処理装置23は、図8に示すように、表面の画像を左側、裏面の画像を右側に配置し、葉書2が図9(a)に示すように縦長に使用されている場合には、図9(b)に示すように、葉書2の表面と裏面との長辺を対応させて合成する。
また、画像処理装置23は、葉書2が図10(a)に示すように横長に使用されている場合には、図10(b)に示すように、葉書2の表面と裏面との短辺を対応させて合成する。
画像処理装置23は、このようにして、葉書2の表面と裏面との合成を行い、1枚の画像データを生成する。
以上が画像処理装置23の(1)〜(4)の処理の説明である。
図2に戻り、プログラムコード記憶装置24は、CPU25が実行するプログラムを記憶するためのものであり、ROM等によって構成される。
CPU25は、プログラムコード記憶装置24に格納されているプログラムに従って、各部を制御する。
具体的には、CPU25は、後述するカメラ基本処理を実行し、まず、カメラ部11の撮影条件の初期化を行う。撮影条件には、カメラ部11のフォーカス、シャッター速度(露光時間)、絞りなどの露出、ホワイトバランス、ISO感度などが含まれる。CPU25は、オートフォーカス測定、測光などを行って撮影が最適になる条件を探して、その条件となるように画像データ生成部10の初期化を行う。
また、CPU25は、メモリ21の初期化、通信、画像処理等に用いるデータの初期化等を行う。
また、CPU25は、ユーザインタフェース部30の操作部32から操作情報が供給されると、この操作情報に従って各部を制御する。
即ち、操作部32から、シャッターボタンが押下された旨の操作情報が供給されると、CPU25は、低解像度画像撮影を行うように画像データ生成部10を制御する。
CPU25は、イメージセンサ12が取り込んだ画像データをメモリ21のセンサ画像記憶領域21aに記憶するように、イメージセンサ12、メモリ21を制御する。
CPU25は、メモリ21の各記憶領域に記憶された画像として、低解像度のプレビュー画像、斜め撮影補正処理、表裏及び上下検出処理が行われた画像、葉書2の画像の向きを修正した画像、葉書2の表裏の画像を合成した画像、保存画像を表示するように、ユーザインタフェース部30の表示部31を制御する。
また、操作部32から、補正キーが押下された旨の操作情報が供給されると、CPU25は、画像処理装置23に斜め撮影補正処理、表裏及び上下検出処理を実行するように指示する。
また、操作部32から、画像を保存する旨の決定キーが押下された旨の操作情報が供給されると、CPU25は、この画像データをユーザインタフェース部30の外部記憶部34に記憶する。
CPU25は、葉書2を表裏の2枚の画像を撮影したか否かの判定を行う。このため、CPU25は、カウンタを備え、画像データ生成部10の撮影回数をカウントする。CPU25は、このカウンタのカウント値をメモリ21の作業データ記憶領域21dに記憶する。
そして、CPU25は、このカウント値が2になると、葉書2の表裏を撮影したと判定し、画像処理装置23に画像合成処理を実行するように指示する。
次に本実施形態に係るデジタルカメラ1の動作を説明する。
操作者がデジタルカメラ1の電源をONすると、デジタルカメラ1のCPU25は、プログラムコード記憶装置24からプログラムコードを読み出してカメラ基本処理を実行する。
このカメラ基本投影処理の内容を図11及び図12に示すフローチャートに従って説明する。
CPU25は、光学レンズ装置11の周辺回路を制御して、光学レンズ装置11の焦点、ズームレンズ位置、絞りなどのカメラ設定と、ビデオ出力装置22等の初期化と、を行う(ステップS11)。
CPU25は、メモリ21の初期化、通信、画像処理等に用いるデータの初期化を行う(ステップS12)。
CPU25は、表示部31にプレビュー画像を表示させ、操作者がシャッターを押下した旨の操作情報が供給されるまで、待機する(ステップS13)。
操作者がシャッターを押下すると、操作部32はCPU25に、この操作情報を供給し、CPU25は、画像生成部に撮影を行うように制御する(ステップS14)。
CPU25は、画像処理装置23に輪郭取得処理を行うように指示する(ステップS15)。
画像処理装置23は、CPU25に制御され、図13に示すフローチャートに従って輪郭取得処理を実行する。
画像処理装置23は、数1,2に従い、2値エッジ画像を作成する(ステップS41)。
画像処理装置23は、直線を検出するため、数3を用いてハフ変換を行う(ステップS42)。
画像処理装置23は、45°≦θ225°の範囲で、ρが+,−それぞれにおいて、投票が多い座標を輪郭取得候補として、その座標を複数取得する(ステップS43)。このとき、ρが+である候補は上辺に対応し、ρが−である候補は下辺に対応する。
画像処理装置23は、投票の多い順に投票テーブルを作成する(ステップS44)。
画像処理装置23は、取得した複数の候補のうち、上下左右それぞれで中心からの距離が最大の座標から順番に並び替える(ステップS45)。
画像処理装置23は、上下左右の辺候補の交点を算出し、算出した交点を輪郭の4頂点とする(ステップS46)。
画像処理装置23は、頂点が葉書2の画像内か否かを判定する(ステップS47)。
頂点が葉書2の画像内ではないと判定した場合(ステップS47においてNo)、画像処理装置23は、次の候補を選択する(ステップS48)。
4頂点が葉書2の画像内であると判定した場合(ステップS47においてYes)、画像処理装置23は、全候補について、葉書2の画像内の輪郭の4頂点を算出できたか否かを判定する(ステップS49)。
算出できなかったと判定した場合(ステップS49においてNo)、画像処理装置23は、再度、ステップS46〜S48を実行する。
算出できたと判定した場合(ステップS49においてYes)、画像処理装置23は、輪郭候補のすべての4頂点の座標をメモリ21の作業データ記憶領域21dに記憶する(ステップS50)。
画像処理装置23がこのように輪郭取得処理を実行すると、CPU25は、操作者が補正対象を選択できるように、輪郭候補のプレビュー画像を表示部31に表示させる(図11のステップS16)。
CPU25は、輪郭線を表示するように表示部31を制御する(ステップS17)。
操作者が輪郭を指定すると、操作部32は、この操作情報をCPU25に供給し、CPU25は、指定された輪郭を選択する(ステップS18)。
CPU25は、操作部32からの操作情報に基づいて、輪郭を補正するか否かを判定する(ステップS19)。
CPU25は、補正ボタンが押下された旨の操作情報が供給された場合、輪郭を補正すると判定する(ステップS19においてYes)。この場合、CPU25は、画像処理装置23に、斜め撮影補正処理を実行するように指示する(ステップS20)。
画像処理装置23は、数14により算出した補正後の縦横比と頂点間の距離に基づいて補正後の画像サイズを算出する。画像処理装置23は、数12に従って補正後の座標に基づいて元画像の座標を算出することにより、斜め撮影補正処理を実行する。
CPU25は、画像処理装置23が斜め撮影補正処理を実行すると、画像処理装置23に、表裏及び上下の検出処理を実行するように指示する(ステップS21)。
画像処理装置23は、図14に示すフローチャートに従って、表裏及び上下検出処理を実行する。
画像処理装置23は、斜め撮影補正処理を行った補正画像に対して上下左右をそれぞれ画像の上側として文字認識を行い、それぞれの認識率をr_U,r_D,r_L,r_Rとする(ステップS61)。
画像処理装置23は、上下左右から文字認識を行った結果の認識率r_U,r_D,r_L,r_Rのうちで、最も高かったものを取得する(ステップS62)。
画像処理装置23は、葉書2の画像の向きを、最も高い認識率の方向に設定する(ステップS63)。
画像処理装置23は、葉書2の画像の縦横比及び向きに基づいて、葉書2を縦長の方向に使用しているか否かを判定する(ステップS64)。
葉書2を縦長の方向に使用していると判定した場合(ステップS64においてYes)、画像処理装置23は、葉書2の画像の左上の範囲内に、矩形又は円が存在すると判定する。この場合、画像処理装置23は、この範囲内に存在する矩形又は円を、ハフ変換を用いて検出する(ステップS65)。
一方、葉書2を横長の方向に使用していると判定した場合(ステップS64においてNo)、画像処理装置23は、葉書2の画像の右上の範囲内に矩形又は円が存在していると判定する。この場合、画像処理装置23は、この範囲内に存在する矩形又は円を、ハフ変換を用いて検出する(ステップS66)。
画像処理装置23は、この範囲内で矩形又は円が検出されたか否かを判定する(ステップS67)。
この範囲内で矩形又は円が検出された場合(ステップS67においてYes)、画像処理装置23は、葉書2の面を表と判定する(ステップS68)。
一方、この範囲内で矩形又は円が検出されたなかった場合(ステップS67においてNo)、画像処理装置23は、葉書2の面を裏と判定する(ステップS69)。
画像処理装置23がこのような上下及び表裏検出処理を実行すると、CPU25は、葉書2の画像を、最も高い認識率と判定した方向に向きを設定して表示するように、表示部31を制御する(図11のステップS22)。
CPU25は、操作部32から操作情報に基づいて、操作者から葉書2の画像の向きを修正する旨の指示があったか否かを判定する(ステップS23)。
向きを修正する旨の指示がなかったと判定した場合(ステップS23においてNo)、CPU25は、ステップS25に進む。
向きを修正する旨の指示があったと判定した場合(ステップS23においてYes)、CPU25は、葉書2の画像の向きを指定された向きに回転するように画像処理装置23に指示する。画像処理装置23は、指示された方向に葉書2の画像を回転する。そして、CPU25は、画像処理装置23が回転した画像を表示するように表示部31を制御する(ステップS24)。
CPU25は、撮影枚数が2枚か否かを判定する(ステップS25)。
撮影枚数が2枚ではないと判定した場合(ステップS25においてNo)、CPU25は、再度、ステップS14〜S24を実行する。
撮影枚数が2枚と判定した場合(ステップS25においてYes)、CPU25は、画像処理装置23に、画像合成処理を実行するように指示する(ステップS26)。
CPU25は、画像処理装置23が合成した画像を表示するように表示部31を制御する(ステップS27)。
CPU25は、操作部32から供給された操作情報に基づいて、配置修正の指示があったか否かの判定を行う(ステップS28)。
配置修正の指示がなかったと判定した場合(ステップS28においてNo)、CPU25は、ステップS30に進む。
配置修正の指示があったと判定した場合(ステップS28においてYes)、CPU25は、画像の配置を修正する(ステップS29)。
CPU25は、保存する画像を表示するように表示部31を制御する(ステップS30)。
CPU25は、外部記憶部34に、この画像を保存し(ステップS31)、ステップS14に戻り、操作者にシャッターが押下された旨の操作情報が供給されるまで待機する。
以上説明したように、本実施形態によれば、デジタルカメラ1は、葉書2を撮影して、その画像の輪郭を取得し、斜め撮影補正を行い、表裏面の画像を合成するようにした。
従って、フラットベットスキャナ、コンピュータ等を用いることなく、葉書2の内容を管理しやすいようにデータ化することができる。
また、葉書2の裏表及び上下を判別し、予め決まったフォーマットで表面と裏面とを合成することにより、撮影順序や撮影方向を設定する操作者の手間を省くことができる。
尚、本発明を実施するにあたっては、種々の形態が考えられ、上記実施の形態に限られるものではない。
例えば、上記実施の形態では、文書を葉書2として説明した。しかし、文書は葉書2に限られるものではなく、例えば、封書、名刺等であってもよい。
上記実施形態では、プログラムが、それぞれメモリ等に予め記憶されているものとして説明した。しかし、撮影装置を、装置の全部又は一部として動作させ、あるいは、上述の処理を実行させるためのプログラムを、フレキシブルディスク、CD−ROM(Compact Disk Read-Only Memory)、DVD(Digital Versatile Disk)、MO(Magneto Optical disk)などのコンピュータ読み取り可能な記録媒体に格納して配布し、これを別のコンピュータにインストールし、上述の手段として動作させ、あるいは、上述の工程を実行させてもよい。
さらに、インターネット上のサーバ装置が有するディスク装置等にプログラムを格納しておき、例えば、搬送波に重畳させて、コンピュータにダウンロード等するものとしてもよい。
本発明の実施形態に係るデジタルカメラの外観を示す図である。 図1にデジタルカメラの構成を示すブロック図である。 図2に示すメモリの各記憶領域を示すブロック図である。 葉書の画像を示す図であり、(a)は葉書のプレビュー画像、(b)は、2値エッジ画像、(c)は輪郭候補を表示した画像を示す。 ハフ変換を説明するための図である。 射影パラメータの抽出とアフィン変換の基本的な考え方を説明するための図である。 葉書の切手や料金に関する記載が行われる領域を示す図であり、(a)は、短辺が上の場合、(b)は、長辺が上の場合の領域を示す。 円の検出を行う場合のハフ変換を説明するための図である。 縦長に使用されている葉書の画像合成処理を示す図である。 横長に使用されている葉書の画像合成処理を示す図である。 図1のデジタルカメラが実行するカメラ基本処理(その1)を示すフローチャートである。 図1のデジタルカメラが実行するカメラ基本処理(その2)を示すフローチャートである。 図1のデジタルカメラが実行する輪郭取得処理を示すフローチャートである。 図1のデジタルカメラが実行する表裏及び上下検出処理を示すフローチャートである。
符号の説明
1・・・デジタルカメラ、2・・・葉書、12・・・イメージセンサ、21・・・メモリ、23・・・画像処理装置、25・・・CPU、31・・・表示部、32・・・操作部

Claims (7)

  1. 撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正部と、
    前記撮影画像補正部によって補正された表面画像と裏面画像とを合成する画像合成部と、を備えた、
    ことを特徴とする画像処理装置。
  2. 前記文書は、表面又は裏面に文字が記載されるとともに、予め表面の設定された領域に予め設定された識別印が記載された定型文書であって、
    前記撮影画像補正部は、形状を補正した画像に基づいて、前記定型文書に記載された文字を認識し、文字認識率に基づいて前記定型文書の向きを判別し、判別結果に基づいて前記定型文書の画像の向きを整えて予め前記表面の設定された領域を判別し、判別した領域に前記識別印を検出したときは、前記撮影によって得られた撮影画像が前記定型文書の表面画像と判定し、前記判別した領域に前記識別印が検出されなかったときは、前記撮影画像が前記定型文書の裏面画像と判定し、
    前記画像合成部は、前記撮影画像補正部が判定した前記定型文書の前記表面画像と前記裏面画像とを合成する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記撮影画像補正部は、前記文書の表面画像と裏面画像とから、それぞれ、2値エッジ画像を取得し、取得した2値エッジ画像の輪郭を取得し、取得した輪郭から、画像の頂点座標を取得し、取得した頂点座標を用いて、前記画像の形状を前記文書に対応する形状に射影変換することにより、それぞれの画像の形状を前記文書に対応する形状に補正する、
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 文書の表面と裏面とをそれぞれ撮影する撮影部と、
    前記撮影部の撮影によって得られた文書の画像に対して画像処理を行う画像処理部と、を備え、
    前記画像処理部は、
    前記撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正部と、
    前記撮影画像補正部によって補正された表面画像と裏面画像とを合成する画像合成部と、を備えた、
    ことを特徴とする撮像装置。
  5. 撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する撮影画像補正ステップと、
    前記補正された表面画像と裏面画像とを合成する画像合成ステップと、を備えた、
    ことを特徴とする画像処理方法。
  6. 前記文書は、表面又は裏面に文字が記載されるとともに、予め表面の設定された領域に予め設定された識別印が記載された定型文書であって、
    前記撮影画像補正ステップは、形状を補正した画像に基づいて、前記定型文書に記載された文字を認識し、文字認識率に基づいて前記定型文書の向きを判別し、判別結果に基づいて前記定型文書の画像の向きを整えて予め前記表面の設定された領域を判別し、判別した領域に前記識別印を検出したときは、前記撮影によって得られた撮影画像が前記定型文書の表面画像と判定し、前記判別した領域に前記識別印が検出されなかったときは、前記撮影画像が前記定型文書の裏面画像と判定するステップである、
    ことを特徴とする請求項5に記載の画像処理方法。
  7. コンピュータに、
    撮影によって得られた文書の表面画像と裏面画像とに対して、それぞれの形状を前記文書に対応する形状に補正する手順、
    前記補正された表面画像と裏面画像とを合成する手順、
    を実行させるためのプログラム。
JP2005376666A 2005-12-27 2005-12-27 画像処理装置、撮像装置、画像処理方法及びプログラム Expired - Fee Related JP4591343B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005376666A JP4591343B2 (ja) 2005-12-27 2005-12-27 画像処理装置、撮像装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005376666A JP4591343B2 (ja) 2005-12-27 2005-12-27 画像処理装置、撮像装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007180872A true JP2007180872A (ja) 2007-07-12
JP4591343B2 JP4591343B2 (ja) 2010-12-01

Family

ID=38305581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005376666A Expired - Fee Related JP4591343B2 (ja) 2005-12-27 2005-12-27 画像処理装置、撮像装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4591343B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020183628A1 (ja) 2019-03-13 2020-09-17 株式会社Pfu 画像処理装置、画像読取装置、画像処理方法、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05347701A (ja) * 1992-06-15 1993-12-27 Sharp Corp 両面合成複写装置
JPH1125101A (ja) * 1997-06-27 1999-01-29 Sharp Corp データ処理装置及びデータ処理装置制御プログラムを記憶した媒体
JP2000341501A (ja) * 1999-03-23 2000-12-08 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
JP2002218216A (ja) * 2001-01-19 2002-08-02 Fuji Photo Film Co Ltd 画像読取装置
JP2004272658A (ja) * 2003-03-10 2004-09-30 Geomic Co Ltd 携帯情報端末のテキストデータ入力支援方法及び装置
JP2006339770A (ja) * 2005-05-31 2006-12-14 Canon Inc 画像処理システムおよびその制御方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05347701A (ja) * 1992-06-15 1993-12-27 Sharp Corp 両面合成複写装置
JPH1125101A (ja) * 1997-06-27 1999-01-29 Sharp Corp データ処理装置及びデータ処理装置制御プログラムを記憶した媒体
JP2000341501A (ja) * 1999-03-23 2000-12-08 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
JP2002218216A (ja) * 2001-01-19 2002-08-02 Fuji Photo Film Co Ltd 画像読取装置
JP2004272658A (ja) * 2003-03-10 2004-09-30 Geomic Co Ltd 携帯情報端末のテキストデータ入力支援方法及び装置
JP2006339770A (ja) * 2005-05-31 2006-12-14 Canon Inc 画像処理システムおよびその制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020183628A1 (ja) 2019-03-13 2020-09-17 株式会社Pfu 画像処理装置、画像読取装置、画像処理方法、及びプログラム
US11657632B2 (en) 2019-03-13 2023-05-23 Pfu Limited Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data

Also Published As

Publication number Publication date
JP4591343B2 (ja) 2010-12-01

Similar Documents

Publication Publication Date Title
JP4363151B2 (ja) 撮影装置、その画像処理方法及びプログラム
JP4341629B2 (ja) 撮像装置、画像処理方法及びプログラム
JP5951367B2 (ja) 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
JP4715527B2 (ja) 撮影装置、撮影画像の画像処理方法及びプログラム
JP2005267457A (ja) 画像処理装置、撮影装置、画像処理方法及びプログラム
JP2006074512A (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP2005122323A (ja) 撮影装置、画像処理装置、撮影装置の画像処理方法及びプログラム
US20100225785A1 (en) Image processor and recording medium
JP2007074578A (ja) 画像処理装置、撮影装置、及びプログラム
JP2007074579A (ja) 画像処理装置、及びプログラム
JP6426815B2 (ja) 画像処理装置および画像処理方法
JP4501701B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP2005275447A (ja) 画像処理装置、画像処理方法及びプログラム
JP2017143354A (ja) 画像処理装置及び画像処理方法
JP4182937B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP4600019B2 (ja) 撮影装置、画像処理方法及びプログラム
JP4363154B2 (ja) 撮影装置、その画像処理方法及びプログラム
JP2005269449A (ja) 画像処理装置、画像処理方法及びプログラム
JP4561302B2 (ja) 撮影装置、撮影装置の画像処理方法及びプログラム
JP4591343B2 (ja) 画像処理装置、撮像装置、画像処理方法及びプログラム
JP4363152B2 (ja) 撮影画像投影装置、撮影画像投影装置の画像処理方法及びプログラム
WO2005022915A1 (en) Image capture and projection device and image capture and projection method
JP4363153B2 (ja) 撮影装置、その画像処理方法及びプログラム
JP4524616B2 (ja) 撮影装置、撮影画像の画像処理方法及びプログラム
JP2005267465A (ja) 画像処理装置、撮影画像投影装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4591343

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees