JP6313725B2 - 画像処理装置及びコンピュータ可読記憶媒体 - Google Patents

画像処理装置及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP6313725B2
JP6313725B2 JP2015124950A JP2015124950A JP6313725B2 JP 6313725 B2 JP6313725 B2 JP 6313725B2 JP 2015124950 A JP2015124950 A JP 2015124950A JP 2015124950 A JP2015124950 A JP 2015124950A JP 6313725 B2 JP6313725 B2 JP 6313725B2
Authority
JP
Japan
Prior art keywords
image
unit
act
ser
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015124950A
Other languages
English (en)
Other versions
JP2016201084A (ja
Inventor
徳政 有賀
徳政 有賀
平 和樹
和樹 平
壮 石過
壮 石過
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Publication of JP2016201084A publication Critical patent/JP2016201084A/ja
Application granted granted Critical
Publication of JP6313725B2 publication Critical patent/JP6313725B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/133Evaluation of quality of the acquired characters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/04Mounting of cameras operative during drive; Arrangement of controls thereof relative to the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/634Warning indications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mechanical Engineering (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Description

本発明の実施形態は、画像処理装置及びコンピュータ可読記憶媒体に関する。
倉庫や店舗の管理者は、棚に載せられた多くの物品を管理している。このような管理は、物品を撮影し、画像に写る物品に貼られたラベルに記載されている文字列を識別する装置によって行われている。画像における文字列部分は2値画像領域である。画像の2値画像領域は、装置が文字列を識別できる程度に鮮明でなければならない。そのため、2値画像領域の鮮明度を定量的に判定可能な技術が望まれている。
特許第4412214号公報
本発明の実施形態が解決しようとする課題は、2値画像領域の鮮明度を定量的に判定可能な画像処理装置及びコンピュータ可読記憶媒体を提供することにある。
実施形態によれば、画像処理装置は、演算部と、比較判定部と、出力部を備える。前記演算部は、画像を構成する画素の階調情報に基づいて標準偏差及びエントロピーを計算し、前記標準偏差と前記エントロピーとの比を計算する。前記比較判定部は、前記比と基準値とを比較する。前記出力部は、前記比較判定部による比較結果を出力する。
第1の実施形態に係る一例となる画像処理装置のブロック図。 第1の実施形態に係る一例となる画像処理装置の移動方向を説明する図。 第1の実施形態に係る鮮明度判定に用いられる一例となる指標を説明するための図。 第1の実施形態に係る画像処理装置により算出されるSERの値を示す図。 第1の実施形態に係る画像処理装置による一例となる処理のフローチャート。 第1の実施形態に係る画像処理装置による他の例となる処理のフローチャート。 比較例となる画像を示す図。 第2の実施形態に係る画像処理装置よる鮮明度判定の手法を説明する図。 第2の実施形態に係る画像処理装置による一例となる処理のフローチャート。 第2の実施形態に係る画像処理装置による他の例となる処理のフローチャート。 第3の実施形態に係る一例となる画像処理装置のブロック図。
以下、いくつかの実施の形態について、図面を参照して説明する。
(第1の実施形態)
第1の実施形態について説明する。図1は、第1の実施形態に係る一例となる画像処理装置10のブロック図である。
画像処理装置10は、倉庫や店舗の棚20に載せられた複数の物品の在庫管理等に用いられる。画像処理装置10は、移動体11と、制御部12と、撮影部13と、処理部14と、記憶部15と、表示部16と、音声出力部17を備える。なお、画像処理装置10は、これら全ての要素を必ず備えている必要はない。例えば、画像処理装置10は、少なくとも処理部14及び記憶部15を備える装置であってもよい。
移動体11は、画像処理装置10を何れの方向にも移動可能な台車である。移動体11は、直線状に並べられた棚20の延在方向と平行な方向に走行することもできるし、棚20の延在方向と直交する方向に走行することもできる。
制御部12は、処理部14からの信号に基づいて移動体11の動作を制御する。制御部12は、移動体11の走行方向や、走行の開始及び停止を制御する。移動体11の動作は、処理部14で判断されても、制御部12で判断されてもよい。
撮影部13は、レンズ131を備え、画像を撮影するカメラである。撮影部13は、動画像を撮影するカメラであっても、静止画像を撮影するカメラであってもよい。撮影部13は、撮影した画像のデータを処理部14へ送る。
処理部14は、画像処理装置10の中枢部分に相当する。処理部14は、オペレーティングシステムやアプリケーションプログラムに従って、画像処理装置10の各要素を制御する。処理部14は、演算部141と、比較判定部142を備える。処理部14は、演算部141及び比較判定部142により、撮影部13が撮影した1画像中に含まれる2値画像領域の鮮明度を定量的に判定する。2値画像領域は、例えば、画像における文字や記号などが写る領域である。2値画像領域の鮮明度とは、2値画像領域の認識のし易さ、または、2値画像領域における焦点ぼけの度合いに対応する。この1画像中に含まれる2値画像領域の鮮明度の定量的な判定(以下、鮮明度判定という)の手法については、後述する。
処理部14は、移動体11の動作の指示を制御部12へ送る。なお、処理部14は、処理部14による鮮明度判定の結果自体を制御部12へ送ってもよい。この場合、制御部12は、鮮明度判定に基づいて移動体11の動作を決定する。
処理部14は、表示部16での表示に関する信号を表示部16へ送る。処理部14は、音声出力部17での音声出力に関する信号を音声出力部17へ送る。
記憶部15は、上記オペレーティングシステムやアプリケーションプログラムを記憶するメモリを含む。さらに、記憶部15は、処理部14による処理に必要なワークエリアとなるメモリを含む。さらに、記憶部15は、処理部14による処理に必要なデータを記憶するメモリを含む。記憶部15は、複数の基準値151を記憶している。複数の基準値151は、鮮明度判定のための閾値である。
表示部16は、処理部14からの信号に基づいて映像を表示するディスプレイである。音声出力部17は、処理部14からの信号に基づいて音声を出力するスピーカである。表示部16及び音声出力部17は、出力部である。
図2は、第1の実施形態に係る画像処理装置10の走行方向を説明する図である。図2の左図と図2の右図とは、互いに直交した方向から見た図である。図2の左図を参照すると、画像処理装置10は、移動体11の走行によって棚20の延在方向と平行に移動する。したがって、撮影部13は、棚20の延在方向と平行に移動しながら、棚20に載せられた複数の物品に貼られているそれぞれのラベルを順次撮影することができる。
図2の右図を参照すると、画像処理装置10は、棚20の延在方向と平行な方向への移動を停止し、移動体11の走行によって棚20の延在方向と直交する方向へ移動する。画像処理装置10が棚20の延在方向と直交する方向へ移動するのは、撮影部13と撮影対象(棚20、より具体的には、棚20に載っている物品)との距離を適切に保つためである。なお、撮影部13と撮影対象との距離は、移動体11と棚20との距離と言い換えられる。したがって、画像処理装置10は、撮影部13が順次撮影する各画像に含まれる2値画像領域の鮮明度を保つことができる。
次に、鮮明度判定に用いられる指標について説明する。図3は、第1の実施形態に係る鮮明度判定に用いられる一例となる指標を説明するための図である。図3は、異なる3つの2値画像に関するデータを示す。3つの画像は、それぞれの画像全体が2値画像領域である。図3において「1」で示すデータは、焦点が合っている第1の画像に対応している。第1の画像は、鮮明な画像である。図3において「2」で示すデータは、第1の画像よりも焦点が少しぼけた第2の画像に対応している。第2の画像は、第1の画像よりも不鮮明な画像である。図3において「3」で示すデータは、第2の画像よりもさらに焦点がぼけた第3の画像に対応している。第3の画像は、第2の画像よりもさらに不鮮明な画像である。
図3の左図は、第1の画像、第2の画像及び第3の画像それぞれの任意の1ラインのデータを入力関数として表したグラフである。横軸は1画像の任意の1ラインに含まれる各画素の座標を示し、縦軸は階調(画素値)を示す。処理部14は、鮮明度判定の対象となる1画像のデータから入力関数を生成する。なお、任意の1ラインは、1画像全体の横軸に対応していても、縦軸に対応していてもよい。
図3の中央図は、第1の画像、第2の画像及び第3の画像それぞれのヒストグラムを表したグラフである。横軸は階調を示し、縦軸は画素数を示す。ヒストグラムは、鮮明度判定の対象となる1画像の任意の1ラインに含まれる画素の分布であり、画像を構成する画素の階調情報である。処理部14は、入力関数からヒストグラムを生成する。ヒストグラムの2つのピークは、2値画像が鮮明になるほど鋭くなる。さらに、ヒストグラムの2つのピークの位置は、2値画像が鮮明になるほど離れる。
図3の右図は、第1の画像、第2の画像及び第3の画像それぞれにおける標準偏差σとエントロピーSとの比(σ/S)(以下、SERという)を表したグラフである。処理部14は、以下に示す計算式を用いてヒストグラムに基づいて標準偏差σ及びエントロピーSを計算する。その後、処理部14は、標準偏差σ及びエントロピーSに基づいてSERを計算する。
標準偏差σの計算式は、以下とおりである。
ここで、
エントロピーSの計算式は、以下のとおりである。
ここで、niはヒストグラムにおける階調iの画素数、nはヒストグラムにおける全画素数である。
標準偏差σは、ヒストグラムにおける少なくとも2つのピークの分離度を表す指標である。エントロピーSは、ヒストグラムにおけるピークの鋭さを表す指標である。SERは、2値画像領域の鮮明度を定量的に表す指標である。標準偏差σは、ヒストグラムの2つのピークが離れるほど大きくなる。エントロピーSは、ヒストグラムの2つのピークが鋭くなるほど小さくなる。標準偏差σが大きく、エントロピーSが小さければ、SERの値は大きい。
図3の右図を参照すると、SERは、第3の画像、第2の画像、第1の画像の順で大きい。この順序は、焦点ぼけの度合いが軽減される画像の順序と一致している。SERが大きければ、2値画像領域は鮮明であるといえる。したがって、SERは、2値画像領域の鮮明度を定量的に表す指標として有効である。
なお、SERは、ヒストグラムにおける少なくとも2つのピークの分離度を表す指標(一例が標準偏差σ)と、ヒストグラムにおけるピークの鋭さを表す指標(一例がエントロピーS)との比であればよい。そのため、処理部14は、標準偏差σやエントロピーS以外の指標を用いてSERを計算してもよい。例えば、標準偏差σの大きさは、画像全体の明るさによって変わる。そのため、処理部14は、標準偏差σの代わりに標準偏差σを平均値mで割った変動係数を用いてSERを計算することが好ましい。処理部14は、標準偏差σの代わりに標準偏差σの2乗である分散を用いてSERを計算してもよい。処理部14は、エントロピーSを計算する際に各階調の画素数niを全画素数nで割っているが、各階調の画素数niを全画素数nで割らなくてもよい。
なお、SERは、1画像の任意の1ラインに基づいて算出される値に限られるものではない。例えば、SERは、1画像の任意の複数ラインまたは全ラインから算出される複数のSERの平均値であってもよい。
次に、異なる画像におけるSERの違いについて説明する。図4は、第1の実施形態に係る処理部14によって計算されるSERを示す図である。図4は、同一の文字列ABCDが写る異なる3つの画像、それぞれのヒストグラム及びそれぞれのSERを示す。
図4の左図は、焦点が合っている第4の画像を示す。第4の画像は、鮮明な2値画像である。第4の画像は、全体が2値画像領域である。図4の中央図は、第4の画像よりも焦点がぼけた第5の画像を示す。第5の画像は、第4の画像よりも不鮮明な2値画像である。第5の画像は、全体が2値画像領域である。図4の右図は、第4の画像よりも焦点がぼけているが、第5の画像よりも焦点が合っている第6の画像を示す。第6の画像は、第4の画像よりも不鮮明であるが、第5の画像よりも鮮明な画像である。ただし、第6の画像は、全体にわたって第4の画像よりもコントラストの小さい画像である。
処理部14は、図3を用いて上述したように、第4の画像、第5の画像及び第6の画像それぞれの標準偏差σ、エントロピーS及びSERを計算することができる。
図4の左図に示すように、第4の画像の標準偏差σは82、エントロピーSは0.6、SERは68である。図4の中央図に示すように、第5の画像の標準偏差σは71、エントロピーSは1.1、SERは31である。図4の右図に示すように、第6の画像の標準偏差σは31、エントロピーSは0.5、SERは29である。
第4の画像のSERは、第5の画像のSERの2倍以上である。これは、2つの画像のエントロピーSの差が効いているからである。一方、第6の画像のSERは、第4の画像のSERの約1/2である。これは、2つの画像の標準偏差σの差が効いているからである。
処理部14は、SERと基準値とを比較することで、画像に含まれる2値画像領域が鮮明か否かを判定することができる。SERが基準値よりも大きければ、処理部14は、2値画像領域は鮮明であると判断する。一方、SERが基準値よりも大きくなければ、処理部14は、2値画像領域は鮮明ではない、または、画像自体のコントラストが小さいと判断する。このように、SERは、2値画像領域の鮮明度の状態を評価できる指標であるだけではなく、画像自体のコントラストの状態も同時に評価できる指標である。したがって、SERは、2値画像領域の鮮明度を定量的に表す指標として有効である。
次に、画像処理装置10による処理の一例を説明する。図5は、第1の実施形態に係る画像処理装置10による一例となる処理のフローチャートである。
移動体11は、制御部12による制御に基づいて走行を開始する(Act1001)。移動体11は、棚20の延在方向と平行な方向に沿って走行する。撮影部13は、棚20に置かれている物品(撮影対象)を移動しながら撮影する(Act1002)。処理部14は、撮影部13が撮影した画像を取り込む(Act1003)。Act1003において撮影部13から処理部14へ取り込まれた画像は、鮮明度判定の対象となる画像である。処理部14は、鮮明度判定の対象となる画像のエントロピーに基づいて標準偏差σ及びエントロピーSを計算し、標準偏差σ及びエントロピーSに基づいてSERを計算する(Act1004)。Act1004は、例えば処理部14内の演算部141によって行われる。
処理部14は、SERと第1の閾値とを比較する(Act1005)。Act1005は、例えば処理部14内の比較判定部142によって行われる。第1の閾値は、記憶部15に記憶されている第1の基準値に対応する。第1の基準値は、画像に含まれる2値画像領域が鮮明か否かを判断するための基準である。第1の基準値は、任意な値を予め設定できる。例えば、第1の基準値は、予め撮影された鮮明な2値画像領域を含む画像のSERに対応していてもよい。なお、SERが第1の閾値よりも大きくない場合とは、2値画像領域が鮮明ではないこと、または、画像自体に2値画像領域が含まれていないことを意味する。一方、SERが第1の閾値より大きい場合とは、2値画像領域が鮮明であることを意味する。
SERが第1の閾値よりも大きくない場合(Act1005、No)、制御部12は、処理部14からの信号に基づいて移動体11の走行を停止するように制御する(Act1006)。制御部12は、処理部14からの停止命令に基づいて移動体11の走行を停止するように制御する。なお、制御部12は、処理部14から送られるSERと第1の閾値との比較結果に基づいて、移動体11の走行の停止を判断してもよい。
なお、Act1005においてSERは第1の閾値よりも大きくないと処理部14が判断した場合、処理部14は、SERと第1の閾値との比較結果を表示部16及び音声出力部17の少なくとも1つに送ってよい。表示部16及び音声出力部17は、処理部14による比較結果を出力する。表示部16は、処理部14による比較結果を表示することができる。音声出力部17は、処理部14による比較結果を音声で出力することができる。一例として、比較結果はSER及び第1の閾値である。他の例として、比較結果は、2値画像領域が鮮明ではないこと、または撮影部13の焦点が合っていないことなどの警告である。表示部16または音声出力部17による出力により、管理者は、撮影部13が撮影する画像に含まれる2値画像領域の状態を認識することができる。
次に、制御部12は、比較結果に基づいて撮影部13と現在の画像に写る撮影対象との距離を修正するように制御する(Act1007)。Act1007では、制御部12は、撮影部15の焦点が合うように移動体11の位置を制御する。例えば、制御部12は、移動体11と棚20との距離を縮める方向または離す方向に移動体11を所定距離走行させるように制御する。撮影対象は、棚20、より具体的には棚20に載せられた物品である。移動体11の走行距離は任意に設定可能である。Act1002に戻って、撮影部13は再び同一の撮影対象を撮影する。つまり、同一の撮影対象が写る画像のSERが第1の閾値よりも大きくなるまで、画像処理装置10は、Act1002〜Act1007により、同一の撮影対象が写る複数の画像を処理する。
SERが第1の閾値よりも大きい場合(Act1005、Yes)、処理部14は、鮮明度判定の対象となっている現在の画像を記憶部15に保存する(Act1008)。Act1001に戻って、移動体11は走行を開始する。画像処理装置10は、次の撮影対象が写る画像に含まれる2値画像領域の鮮明度判定を行う。
図5に示す処理によれば、画像処理装置10は、SERを用いることで画像に含まれる2値画像領域の鮮明度を定量的に判断することができる。そのため、画像処理装置10は、移動体11と棚20との距離を適切に保ちながら、異なる撮影対象が写る鮮明な各画像を順次保存することができる。
次に、画像処理装置10による処理の他の例を説明する。図6は、第1の実施形態に係る画像処理装置10による他の例となる処理のフローチャートである。
図6のAct2001〜Act2004及びAct2006〜Act2008は、Act1001〜Act1004及びAct1006〜Act1008それぞれと同様であるので、これらの説明を省略する。
Act2005では、処理部14は、鮮明度判定の対象となる現在の画像のSERが極大か否かを判断する。Act2005は、例えば、処理部14内の比較判定部142で行われる。ここでは、鮮明度判定の対象となる画像は撮影対象Xが写る画像であると仮定して、Act2005における処理部14による処理を説明する。
Act2005において、処理部14は、撮影対象Xが写る1枚目の画像のSERが極大か否かを判断する。ただし、この時点では、1枚目の画像のSERと比較する対象となる第2の閾値は記憶部15に記憶されていない。そのため、処理部14は、1枚目の画像のSERを第2の基準値として記憶部15に保存する。つまり、第2の基準値は、現在の画像と同一の撮影対象Xが写る過去の画像のSERに対応する。第2の閾値は、記憶部15に記憶されている第2の基準値に対応する。
その後、Act2006、Act2007及びAct2002〜Act2004を経たAct2005において、処理部14は、撮影対象Xが写る2枚目の画像のSERが極大か否かを判断する。2枚目の画像は、鮮明度判定の対象となる現在の画像である。処理部14は、2枚目の画像のSERと第2の閾値とを比較する。2枚目の画像のSERが第2の閾値よりも大きくない場合、処理部14は、第2の閾値に対応するSERが極大であると判断する。つまり、処理部14は、SERが極大となる撮影対象Xが写る画像を見つけたと判断する。Act2008において、処理部14は、第2の閾値に対応するSERの計算の基となった画像を記憶部15に保存する。つまり、この画像の2値画像領域は鮮明であるといえる。
2枚目の画像のSERが第2の閾値よりも大きい場合、処理部14は、第2の閾値に対応するSERが極大ではないと判断する。つまり、処理部14は、SERが極大となる撮影対象Xが写る画像はまだ見つかっていないと判断する。処理部14は、2枚目の画像のSERに基づいて第2の基準値を更新して記憶部15に保存する。
その後、再度Act2006、Act2007及びAct2002〜Act2004を経たAct2005において、処理部14は、撮影対象Xが写る3枚目の画像のSERが極大か否かを判断する。つまり、画像処理装置10は、Act2005において第2の閾値よりも大きくないSERが見つかるまで、同一の撮影対象Xが写る異なる画像を処理し続ける。以上のように、Act2005において、処理部14は、同一の撮影対象が写る複数の画像の中で極大のSERの計算の基となる画像を判断している。
なお、Act1005において鮮明度判定の対象となる現在の画像のSERが極大ではないと処理部14が判断した場合、図6を用いて説明したように、表示部16及び音声出力部17は、処理部14による比較結果を出力してもよい。一例として、比較結果はSER及び第2の閾値である。他の例として、比較結果は、2値画像領域の鮮明度が極大ではないこと、または撮影部13の焦点が合っていないことなどの警告である。
図6に示す処理によれば、画像処理装置10は、図5に示す処理により得られる画像よりも2値画像領域の鮮明度が高い画像を得ることができる。
(第2の実施形態)
第2の実施形態について説明する。ここでは、第1の実施形態と相違する部分について説明し、第1の実施形態と同様である部分については説明を省略する。
図7は、比較例となる画像を示す図である。図7は、同一の文字列ABCDが写る異なる2つの画像、それぞれのヒストグラム及びそれぞれのSERを示す。図7の左図は、焦点が合っている第7の画像を示す。第7の画像は、鮮明な画像である。図7の右図は、第7の画像よりも焦点がぼけた第8の画像を示す。第7の画像及び第8の画像は、2値画像領域の周りを自然画像領域が囲む画像である。図7の左図に示すように、第7の画像のSERは12である。図7の右図に示すように、第8の画像のSERは8である。焦点が合っている第7の画像のSERと焦点がぼけている第8の画像のSERとの間には十分な差がない。そのため、画像処理装置10は、鮮明度判定の対象となる1画像から1つのSERを算出するだけでは、この画像に含まれる2値画像領域の鮮明度を判断することが難しい可能性がある。そこで、第2の実施形態に係る画像処理装置10は、以下で説明するように鮮明度判定の対象となる1画像を複数のブロックに分割し、各ブロックのSERを算出する。
図8は、第2の実施形態に係る処理部14による鮮明度判定の手法を説明する図である。図8の上段の図は、図7と同一の文字列ABCDの文字列が写された異なる2つの画像を示す。
図8の左上の図は、焦点が合っている第9の画像を示す。第9の画像は、鮮明な画像である。図8の右上の図は、第9の画像よりも焦点が合っていない第10の画像を示す。第10の画像は、第9の画像よりも不鮮明な画像である。第9の画像及び第10の画像は、2値画像領域の周りを自然画像領域が囲む画像である。
第2の実施形態では、処理部14は、鮮明度判定の対象となる1画像を複数のブロックに分割し、各ブロックのSERを算出する。図8の上段の図を参照すると、処理部14は、第9の画像及び第10の画像を64ブロックに分割している。処理部14は、ブロック毎の任意の1ラインのデータに基づいて第1の実施形態で説明したように各ブロックのSERを計算する。なお、任意の1ラインは、各ブロックの横軸または縦軸に対応していてもよい。また、各ブロックのSERは、各ブロックの任意の複数ラインまたは全ラインから算出される複数のSERの平均値であってもよい。なお、画像の分割数は、任意に設定可能である。
図8の左中段の図は、第9の画像の各ブロックに対応する位置にヒストグラムを並べた図である。図8の左下の図は、第9の画像の各ブロックに対応する位置にSERの値を並べた図である。第9の画像では、2値画像領域に対応するブロックのSERは40以上の値である。
図8の右中段の図は、第10の画像の各ブロックに対応する位置にヒストグラムを並べた図である。図8の右下の図は、第10の画像の各ブロックに対応する位置にSERの値を並べた図である。第10の画像では、2値画像領域に対応するブロックのSERは20以下の値である。2値画像領域に対応するブロックにおいて、図7に示す例とは異なり、焦点が合っている画像のSERと焦点が合っていない画像のSERとの差は大きい。そのため、画像処理装置10は、鮮明度判定の対象となる1画像から算出した1つのSERに基づいて2値画像領域の鮮明度を判断することが困難であっても、この画像の各ブロックから算出した各SERに基づいて2値画像領域の鮮明度を十分に判断することができる。
処理部14は、各ブロックのSERと基準値とを比較することで、画像に含まれる2値画像領域が鮮明か否かを判定する。ブロックのSERが基準値よりも大きければ、処理部14は、このブロックに含まれる2値画像領域は鮮明であると判断する。一方、ブロックのSERが基準値よりも大きくなければ、処理部14は、このブロックに含まれる2値画像領域は鮮明ではないと判断する。SERは、自然画像領域と2値画像領域が混在する画像においても、2値画像領域の鮮明度を定量的に表す指標として有効である。
次に、画像処理装置10による処理の一例を説明する。図9は、第2の実施形態に係る画像処理装置10による一例となる処理のフローチャートである。
移動体11は、制御部12による制御に基づいて走行を開始する(Act3001)。移動体11は、棚20の延在方向と平行な方向に沿って走行する。撮影部13は、棚20に置かれている物体(撮影対象)を移動しながら撮影する(Act3002)。処理部14は、撮影部13が撮影した画像を取り込む(Act3003)。Act3003において撮影部13から処理部14へ取り込まれた画像は、鮮明度判定の対象となる画像である。
処理部14は、この画像を複数のブロックに分割する(Act3004)。処理部14は、複数のブロックにおける各ブロックのエントロピーに基づいて各ブロックの標準偏差σ及びエントロピーSを計算し、標準偏差σ及びエントロピーSに基づいて各ブロックのSERを計算する(Act3005)。Act3005は、例えば処理部14内の演算部141で行われる。
処理部14は、各SERの値に基づいてOKブロック数を取得する(Act3006)。OKブロックは、鮮明な2値画像領域を含むブロックに対応する。Act3006において、処理部14は、一例として以下のようにOKブロックの数を取得する。処理部14は、各ブロックのSERと第3の閾値とを比較する。第3の閾値は、記憶部15に記憶されている第3の基準値に対応する。第3の基準値は、各ブロックに含まれる2値画像領域が鮮明か否かを判断するための基準である。第3の基準値は、任意に予め設定できる。例えば、第3の基準値は、予め撮影された鮮明な2値画像領域を含む画像のSERの値に対応していてもよい。なお、ブロックのSERが第3の閾値よりも大きくない場合とは、このブロックに含まれる2値画像領域が鮮明ではないこと、または、このブロック自体に2値画像領域が含まれていないことを意味する。一方、ブロックのSERが第3の閾値より大きい場合とは、このブロックに含まれる2値画像領域が鮮明であることを意味する。
任意のブロックのSERが第3の閾値よりも大きい場合、処理部14は、このブロックをOKブロックと判断する。一方、任意のブロックのSERが第3の閾値よりも大きくない場合、処理部14は、このブロックはOKブロックではないと判断する。処理部14は、鮮明度判定の対象となる画像を構成する全ブロックのSERと第3の閾値とを比較する。処理部14は、鮮明度判定の対象となる画像を構成する全ブロック中のOKブロックの数を取得する。ここでは、鮮明度判定の対象となる画像におけるOKブロック数を、この画像を構成する全ブロック数で割った値を第1の割合というものとする。
処理部14は、第1の割合と第4の閾値とを比較する(Act3007)。第4の基準値は、画像に含まれる2値画像領域が鮮明か否かを判断するための基準である。第4の基準値は、任意に予め設定できる。一例として、第4の基準値は、予め撮影された鮮明な2値画像領域を含む画像におけるOKブロック数を、この画像を構成する全ブロック数で割った値であってもよい。
なお、第1の割合が第1の閾値よりも大きくない場合とは、画像に含まれる2値画像領域が鮮明ではないこと、または、画像自体に2値画像領域が含まれていないことを意味する。一方、第1の割合が第1の閾値より大きい場合とは、画像に含まれる2値画像領域が鮮明であることを意味する。
第1の割合が第4の閾値よりも大きくない場合(Act3007、No)、制御部12は、処理部14からの信号に基づいて移動体11の走行を停止するように制御する(Act3008)。Act3008において、画像処理装置10は、上述したAct1006と同様に処理してもよい。なお、Act3007において第1の割合が第4の閾値よりも大きくないと処理部14が判断した場合、図5を用いて説明したように、表示部16及び音声出力部17は、比較結果を出力してもよい。一例として、比較結果は第1の割合及び第4の閾値である。他の例として、比較結果は、2値画像領域が鮮明でないこと、または撮影部13の焦点が合っていないことなどの警告である。
次に、制御部12は、撮影部15の焦点が合うように移動体11の位置を修正するように制御する(Act3009)。Act3009において、画像処理装置10は、上述したAct1007と同様に処理してもよい。Act3002に戻って、撮影部13は再び同一の撮影対象を撮影する。つまり、同一の撮影対象が写る画像における第1の割合が第4の閾値よりも大きくなるまで、画像処理装置10は、Act3002〜Act3009により、同一の撮影対象が写る複数の画像を処理する。
第1の割合が第4の閾値よりも大きい場合(Act3007、Yes)、処理部14は、鮮明度判定の対象となっている現在の画像を記憶部15に保存する(Act3010)。Act3001に戻って、移動体11は走行を開始する。画像処理装置10は、次の撮影対象が写った画像に含まれる2値画像領域の鮮明度判定を行う。
次に、画像処理装置10による処理の他の例を説明する。図10は、第2の実施形態に係る画像処理装置10による他の例となる処理のフローチャートである。
図10のAct4001〜Act4006及びAct4008〜Act4010は、図9のAct3001〜Act3006及びAct3008〜Act3010と同様であるので、これらの説明を省略する。
Act4007では、処理部14は、鮮明度判定の対象となる現在の画像の第1の割合が極大か否かを判断する。Act4007は、処理部14内の比較判定部142で行われる。ここでは、鮮明度判定の対象となる画像は撮影対象Yが写る画像であると仮定して、Act4007における処理部14による処理を説明する。
Act4007において、処理部14は、撮影対象Yが写る1枚目の画像の第1の割合が極大か否かを判断する。ただし、この時点では、1枚目の画像の第1の割合と比較する対象となる第5の閾値は記憶部15に記憶されていない。そのため、処理部14は、1枚目の画像の第1の割合を第5の基準値として記憶部15に保存する。つまり、第5の基準値は、現在の画像と同一の撮影対象Yが写る過去の画像の第1の割合に対応する。第5の閾値は、記憶部15に記憶されている第5の基準値に対応する。
その後、Act4008、Act4009及びAct4002〜Act4006を経たAct4007において、処理部14は、撮影対象Yが写る2枚目の画像の第1の割合が極大か否かを判断する。2枚目の画像は、鮮明度判定の対象となる現在の画像である。処理部14は、2枚目の画像の第1の割合と第5の閾値とを比較する。2枚目の画像の第1の割合が第5の閾値よりも大きくない場合、処理部14は、第5の閾値に対応する第1の割合が極大であると判断する。つまり、処理部14は、第1の割合が極大となる撮影対象Yが写る画像を見つけたと判断する。Act4010において、処理部14は、第5の閾値に対応する第1の割合の計算の基となった画像を記憶部15に保存する。つまり、この画像の2値画像領域は鮮明であるといえる。
2枚目の画像の第1の割合が第5の閾値よりも大きい場合、処理部14は、第5の閾値に対応する第1の割合が極大ではないと判断する。つまり、処理部14は、第1の割合が極大となる撮影対象Yが写る画像はまだ見つかっていないと判断する。処理部14は、2枚目の画像の第1の割合に基づいて第5の基準値を更新して記憶部15に保存する。
その後、再度Act4008、Act4009及びAct4002〜Act4006を経たAct4007において、処理部14は、撮影対象Yが写る3枚目の画像の第1の割合が極大か否かを判断する。つまり、画像処理装置10は、Act4007において第5の閾値よりも大きくない第1の割合が見つかるまで、同一の撮影対象Yが写る異なる画像を処理し続ける。以上のように、Act4007において、処理部14は、同一の撮影対象が写る複数の画像の中で極大の第1の割合の計算の基となる画像を判断している。
なお、Act4007において鮮明度判定の対象となる現在の画像の第1の割合が極大ではないと処理部14が判断した場合、図5を用いて説明したように、表示部16及び音声出力部17は、比較結果を出力してもよい。一例として、比較結果は第1の割合及び第5の閾値である。他の例として、比較結果は、2値画像領域の鮮明度が極大ではないこと、または撮影部13の焦点が合っていないことなどの警告である。
第2の実施形態に係る画像処理装置10は、第1の実施形態に係る画像処理装置10よりも、自然画像領域と2値画像領域が混在する画像における2値画像領域の鮮明度を正確に判定することができる。
(第3の実施形態)
第3の実施形態について説明する。図11は、第3の実施形態に係る一例となる画像処理装置10のブロック図である。なお、第1の実施形態と同様の構成には同一の参照符号を付し、その説明を省略する。
第3の実施形態に係る撮影部13は、オートフォーカス機能及びフォーカス判定機能を備えたカメラである。撮影部13は、処理部14からの信号に基づいて、フォーカスを修正する。
次に、第3の実施形態に係る画像処理装置10による処理の例を説明する図5、6、9及び10を再度用いて説明する。図5のAct1007、図6のAct2007、図9のAct3009及び図10のAct4009において、第3の実施形態に係る画像処理10は、第1の実施形態及び第2の実施形態と異なる処理を行う。
図5のAct1007、図6のAct2007、図9のAct3009及び図10のAct4009において、撮影部13は、比較結果に基づいて、撮影対象に対する撮影部13の焦点が合うようにフォーカスを修正する。フォーカスの修正量は任意に設定可能である。なお、撮影部13は、処理部14から送られる比較結果に基づいてフォーカスを修正しても、処理部14から送られるフォーカス修正量の情報に基づいてフォーカスを修正するようにしてもよい。
図5のAct1007、図6のAct2007、図9のAct3009及び図10のAct4009の後、撮影部13は、フォーカスを修正した状態で再び同じ対象を撮影する。
第3の実施形態によれば、第1の実施形態及び第2の実施形態と同様の効果を得ることができる。
動作を実行する主体は例えば、ハードウェア、ハードウェアとソフトウェアとの複合体、ソフトウェア、及び実行中のソフトウェアなどといった、コンピュータに係る主体である。動作を実行する主体は例えば、プロセッサ上で実行されるプロセス、プロセッサ、オブジェクト、実行ファイル、スレッド、プログラムおよびコンピュータであるがこれらに限るものではない。例えば、画像処理装置やそこで実行されるアプリケーションが動作を実行する主体であってもよい。プロセスやスレッドに、動作を実行する主体を複数演じさせてもよい。動作を実行する主体が1つの画像処理装置内にあってもよいし、複数の画像処理装置へ分配されたかたちであってもよい。
装置内部に以上説明した機能が予め記録されていてもよいし、同様の機能をネットワークから装置にダウンロードしてもよいし、同様の機能を記録媒体に記憶させたものを装置にインストールしてもよい。記録媒体としては、ディスクROMやメモリカード等プログラムを記憶でき、かつ装置が読み取り可能な記録媒体であれば、その形態は何れの形態であっても良い。またこのように予めインストールやダウンロードにより得る機能は装置内部のOS(オペレーティング・システム)等と協働してその機能を実現させるものであってもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10…画像処理装置、11…移動体、12…制御部、13…撮影部、14…処理部、15…記憶部、16…表示部、17…音声出力部、20…棚、131…レンズ、141…演算部、142…比較判定部、151…基準値。

Claims (7)

  1. 画像を構成する画素の階調情報に基づいて標準偏差及びエントロピーを計算し、前記標準偏差と前記エントロピーとの比を計算する演算部と、
    前記比と基準値とを比較する比較判定部と、
    前記比較判定部による比較結果を出力する出力部と、
    を備える画像処理装置。
  2. 前記画像を撮影する撮影部を備える、請求項1記載の画像処理装置。
  3. 当該画像処理装置を移動する移動体を備える、請求項2記載の画像処理装置。
  4. 前記移動体の動作を制御する制御部を備え、
    前記制御部は、前記比較結果に基づいて前記撮影部と前記画像に写る対象との距離を修正するように前記移動体を制御する、請求項3記載の画像処理装置。
  5. 前記演算部は、前記画像を複数のブロックに分割し、各ブロックの前記標準偏差及び前記エントロピーを計算する、請求項1記載の画像処理装置。
  6. 前記比の値に基づいて前記基準値を更新して記憶する記憶部を備える、請求項1記載の画像処理装置。
  7. 画像を構成する画素の階調情報に基づいて標準偏差及びエントロピーを計算することと、
    前記標準偏差と前記エントロピーとの比を計算することと、
    前記比と基準値とを比較することと、
    前記比と基準値との比較結果を出力すること、
    をコンピュータに実行させるプログラムを記憶したコンピュータ可読記憶媒体。
JP2015124950A 2015-04-07 2015-06-22 画像処理装置及びコンピュータ可読記憶媒体 Active JP6313725B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/680,845 US9466001B1 (en) 2015-04-07 2015-04-07 Image processing apparatus and computer-readable storage medium
US14/680,845 2015-04-07

Publications (2)

Publication Number Publication Date
JP2016201084A JP2016201084A (ja) 2016-12-01
JP6313725B2 true JP6313725B2 (ja) 2018-04-18

Family

ID=57046398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015124950A Active JP6313725B2 (ja) 2015-04-07 2015-06-22 画像処理装置及びコンピュータ可読記憶媒体

Country Status (2)

Country Link
US (3) US9466001B1 (ja)
JP (1) JP6313725B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017187988A (ja) 2016-04-07 2017-10-12 東芝テック株式会社 コード認識装置
US20190202372A1 (en) * 2018-01-03 2019-07-04 Getac Technology Corporation Vehicular image pickup device and image capturing method
CN110536073B (zh) * 2018-05-25 2021-05-11 神讯电脑(昆山)有限公司 车用取像装置及影像撷取方法
CN110536063B (zh) * 2018-05-25 2021-06-15 神讯电脑(昆山)有限公司 车用取像装置及影像撷取方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19637629A1 (de) * 1996-09-16 1998-03-19 Eastman Kodak Co Elektronische Kamera zur Realisierung der Abbildungseigenschaften einer Studio-Balgenkamera
JPH10105873A (ja) * 1996-09-30 1998-04-24 Toshiba Corp 車両のナンバプレート認識装置
US7212666B2 (en) * 2003-04-01 2007-05-01 Microsoft Corporation Generating visually representative video thumbnails
JP4412214B2 (ja) 2005-03-29 2010-02-10 日本電気株式会社 パターン認識装置、パターン認識方法およびそのパターン認識装置をもつ電子機器
US8671346B2 (en) * 2007-02-09 2014-03-11 Microsoft Corporation Smart video thumbnail
JP5554776B2 (ja) * 2008-05-30 2014-07-23 ジーイー・ヘルスケア・バイオサイエンス・コーポレイション 1以上のデフォーカス画像又は低コントラスト対雑音比画像を検出し除去するシステム及び方法
US20120075440A1 (en) * 2010-09-28 2012-03-29 Qualcomm Incorporated Entropy based image separation
AU2013237949A1 (en) * 2012-03-28 2014-11-13 University Of Houston System Methods and software for screening and diagnosing skin lesions and plant diseases
JP5874497B2 (ja) * 2012-03-30 2016-03-02 ブラザー工業株式会社 画像処理装置および画像処理プログラム
US9317764B2 (en) * 2012-12-13 2016-04-19 Qualcomm Incorporated Text image quality based feedback for improving OCR
US9858656B2 (en) * 2013-03-13 2018-01-02 Raytheon Company Video interpretability and quality estimation
US9098888B1 (en) * 2013-12-12 2015-08-04 A9.Com, Inc. Collaborative text detection and recognition
US9965588B2 (en) * 2014-03-06 2018-05-08 Ricoh Co., Ltd. Film to DICOM conversion
US9549125B1 (en) * 2015-09-01 2017-01-17 Amazon Technologies, Inc. Focus specification and focus stabilization

Also Published As

Publication number Publication date
US20160300112A1 (en) 2016-10-13
US20160381283A1 (en) 2016-12-29
US10257406B2 (en) 2019-04-09
US9466001B1 (en) 2016-10-11
US20190191075A1 (en) 2019-06-20
JP2016201084A (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
US10917571B2 (en) Image capture device control based on determination of blur value of objects in images
KR101803712B1 (ko) 화상처리장치, 제어 방법, 프로그램 및 기록 매체
JP6313725B2 (ja) 画像処理装置及びコンピュータ可読記憶媒体
JP2017006330A (ja) 医療用画像処理装置、医療用画像処理方法、及び、医療用観察システム
JP5187035B2 (ja) 撮像装置および画像処理装置、並びに画像処理プログラム
EP2938064B1 (en) Method and apparatus for determining exposure setting
TW201541141A (zh) 使用多鏡頭的自動對焦系統及其方法
US20160112646A1 (en) Image processing apparatus, image pickup apparatus, and image processing method
JP2016046642A (ja) 情報処理システム、情報処理方法及びプログラム
JP2018195084A (ja) 画像処理装置及び画像処理方法、プログラム、記憶媒体
JP2016063248A (ja) 画像処理装置および画像処理方法
JP2016178608A5 (ja)
JP6395429B2 (ja) 画像処理装置、その制御方法及び記憶媒体
TW201541143A (zh) 使用多鏡頭的自動對焦系統及其方法
CN110619616B (zh) 一种图像处理方法、装置和相关设备
US20200134840A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP6290038B2 (ja) 電子機器、方法及びプログラム
JP2017123589A (ja) 情報処理装置、情報処理方法および映像投影システム
US10304168B2 (en) Image processing apparatus, image pickup apparatus, image processing method, and non-transitory computer-readable storage medium for correcting deterioration of image
JP6373671B2 (ja) 電子機器、方法及びプログラム
JP2015156189A (ja) 画像評価装置、および画像評価プログラム
CN112740649A (zh) 拍摄方法、拍摄设备及计算机可读存储介质
JP2019096364A (ja) 画像評価装置
JP2020086216A (ja) 撮像制御装置、撮像装置及び撮像制御プログラム
JP6381212B2 (ja) 撮像装置及びその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180323

R150 Certificate of patent or registration of utility model

Ref document number: 6313725

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150