JP2006107034A - 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム - Google Patents

画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム Download PDF

Info

Publication number
JP2006107034A
JP2006107034A JP2004291468A JP2004291468A JP2006107034A JP 2006107034 A JP2006107034 A JP 2006107034A JP 2004291468 A JP2004291468 A JP 2004291468A JP 2004291468 A JP2004291468 A JP 2004291468A JP 2006107034 A JP2006107034 A JP 2006107034A
Authority
JP
Japan
Prior art keywords
image
straight line
edge
cumulative frequency
intercept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004291468A
Other languages
English (en)
Inventor
Rieko Izume
理恵子 井爪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Photo Imaging Inc
Original Assignee
Konica Minolta Photo Imaging Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Photo Imaging Inc filed Critical Konica Minolta Photo Imaging Inc
Priority to JP2004291468A priority Critical patent/JP2006107034A/ja
Publication of JP2006107034A publication Critical patent/JP2006107034A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ページ厚さがある文書や枠板を有するホワイトボードが被写体とされた画像であっても、正確に文書領域やホワイトボード領域を検出できるようにする。
【解決手段】 ホワイトボードを含む解析対象画像Sから、ホワイトボードに由来するエッジ画像を作成すると共に、そのエッジ画素についてハフ変換投票処理を行い傾き−切片座標データを求める。該データから、累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報h11,h12を直線候補として抽出し、さらに累積度数が最大となる直線情報を求める。そして、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線h12を検出して第1辺を求める。同様にして、他の辺も特定し、その4辺で区画される領域を特定領域として抽出する。
【選択図】 図9

Description

本発明は、デジタルカメラ等で取得された画像から自動的に特定の領域、例えば画像から白板領域や文書領域を検出する画像解析方法及び装置、さらには検出した特定領域の画像に対してあおり補正や下地とばし処理等の画像処理を行う画像処理方法及びシステム、これらの動作プログラムに関するものである。
一般に、デジタルカメラは、画像処理により撮影された画像の画質を自在に制御できるため、撮影の目的や被写体の種類に応じて撮影画像の画質に対して適切な処理を行うことにより、銀塩フィルムに撮影するカメラに比してより好適な画質の画像を得ることができるという利点を有する。このため、通常の写真撮影だけでなく、例えば会議場でホワイトボード(白板)に描かれた文字や図形情報等を撮影したり、雑誌に掲載されている文字情報等を撮影したりして持ち帰るといった活用も為されている。
デジタルカメラで文字や図形等が描かれたホワイトボードを撮影する場合、その撮影の目的はホワイトボード上の文字や図形等の情報を記録することにある。このため、上記のような撮影画像については、文字や図形等の情報部分の明瞭度を向上させるために、画像のゆがみを補正する「あおり補正」や、ホワイトボードの白地部分への色かぶりを補正する「下地とばし処理」等の画像処理を行うことが望ましい。これらの画像処理を実際に行う場合、撮影画像からホワイトボード領域や文書領域(特定領域)を検出した上で、この検出された特定領域の画像に対して処理が実行される。
前記あおり補正や下地とばし処理等の目的で特定領域を検出する場合、あおり補正については、画像のゆがみ補正をより正確に行うためには領域の外周辺(四辺)が正確に検出することが、また下地とばし処理については、処理後の見栄えを良くするためにはホワイトボードの枠部等を含むことなく白地部分のみを特定領域として検出することが望ましい。すなわち、例えば図15(a)に示すように、ページ厚さ8Bがある文書が撮影された画像S1において文書領域8を検出する場合、図15(b)に示すように、最上面にある文書(書籍の場合は見開かれているページ)の領域を画定する輪郭線8L−1を特定領域として検出することが望ましい。また、図16(a)に示すように、枠板を備えるホワイトボードが撮影された画像S2においてホワイトボード領域9を検出する場合、図16(b)に示すように、前記枠板に対応する枠部90の画像領域の内側輪郭線9L−1を特定領域として検出することが望ましい。
文書やホワイトボード等が撮影された画像から、当該文書領域やホワイトボード領域を検出する方法として、例えば特許文献1には、ハフ変換投票処理によって矩形状の領域の四辺に対応する直線をそれぞれ検出し、この直線によって区画される領域を前記特定領域として検出する方法が開示されている。この方法は、ページ厚さがさほど無い文書や、枠板が無い(或いは枠板が狭幅)ホワイトボードが被写体とされた画像の場合は有用な領域検出方法であるが、図15(a)のようにページ厚さ8Bがある文書が撮影された画像や、図16(a)のように相当の幅を備えた枠板を有するホワイトボードが撮影された画像である場合、前述した望ましい特定領域を正確に検出できない場合があった。
すなわち、ページ厚さ8Bがある文書の場合、図15(c)に示すように、前記ページ厚さ8Bを含む輪郭線8L−2を検出し、これを特定領域として誤検出してしまう場合がある。また枠板を有するホワイトボードの場合、図16(c)に示すように、前記枠板に対応する枠部90を含む輪郭線9L−2(枠部90の外側の輪郭線)を検出し、これを特定領域として誤検出してしまう場合がある。このような特定領域が検出されてしまうと、画像処理により正確なあおり補正が行えず、また見栄えの良い下地とばし処理を行うことができないという問題があった。
特開2004−96435号公報
本発明は以上の点に鑑みて為されたもので、ページ厚さがある文書や枠板を有するホワイトボードが被写体とされた画像であっても、正確に文書領域やホワイトボード領域を検出でき、これによりあおり補正や下地とばし処理等の画像処理を施すに当たって最適な特定領域を検出できる画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラムを提供することを課題とする。
本発明の請求項1にかかる画像解析方法は、解析対象画像からエッジを抽出してエッジ画像を作成すると共に、該エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求め、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出すると共に、この抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求め、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出して第1辺を求め、前記第1領域とは異なる第2領域内において同様にして第2辺を求め、少なくとも前記第1辺及び第2辺で区画される領域を特定領域として検出することを特徴とする。
この方法によれば、ハフ変換投票処理に基づく傾き−切片座標データから、
(1)当該傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出することで、検出すべき特定領域を区画する直線の候補を検出する。
(2)また、解析対象画像の第1領域内(例えばホワイトボードを被写体として含む画像の場合は、その上辺が含まれている領域)において前記傾き−切片座標における累積度数が最大となる直線情報を求めることで、判定基準線ともいうべき直線情報を特定する。
(3)そして、累積度数最大直線(判定基準線)よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出して第1辺を求めるようにすることで、ホワイトボードの枠部や文書のページ厚さを含んだ状態で辺(第1辺)が特定されないようにしている。
例えば、上記(2)のステップにおいて、ホワイトボード枠部の「外側辺」に相当するエッジが前記第1領域において累積度数最大直線として検出された場合、上記(1)のステップで抽出されている直線の候補に対して、上記(3)のステップによる「所定値Kc以内に存在する直線」という絞りを加えることにより、ホワイトボード枠部の「内側辺」に相当するエッジに基づく直線が前記第1辺として検出される可能性が高くなる。つまり上記(3)の絞りにより、ホワイトボード枠部の「外側辺」(累積度数最大直線)よりも外側の画像部分において検出されている直線は前記第1辺として検出されることはない。
また、ホワイトボードに図形線等が描かれているような場合、該図形線等も上記(1)のステップで直線の候補として抽出される可能性がある(但し、短い直線や途切れた直線は累積度数不足として直線候補には挙がらず、また前記「外側辺」に対して角度を持った直線は傾きが所定値以上であるとして直線候補には挙がらない)が、このような直線候補は、累積度数最大直線から画像の中心側(内側)に向けてかなり離間した位置にあるのが通常であるから、かかる直線候補も篩い落とされることとなる。従って、ホワイトボード等において特定領域を検出する場合に最も望ましいホワイトボード枠部の「内側辺」に対応する直線候補が、前記第1領域における第1辺として選定される可能性が高くなるものである。なお、前記累積度数最大直線よりも画像の中心側に該当する直線候補が存在しない場合は、この累積度数最大直線がホワイトボード枠部の「内側辺」として検出されている可能性が高いので、これを第1辺として特定すればよい。
以上のような処理を、前記第1領域とは異なる解析対象画像の第2領域内(例えばホワイトボードを被写体として含む画像の場合は、その下辺が含まれている領域)においても行えば、当該第2領域におけるホワイトボード枠部の「内側辺」に対応する直線候補が第2辺として選定される可能性が高くなる。従って、前記第1辺と第2辺とで区画される領域を特定領域として検出することで、少なくともホワイトボード枠部の「内側辺」の間に相当する画像が特定領域として検出できるようになる。
請求項2にかかる画像解析方法は、前記累積度数最大直線よりも解析対象画像の中心側方向の所定距離以内に存在する直線が複数存在する場合に、最も中心側方向に近い位置に存在する直線を選択して前記第1辺若しくは第2辺として定めることを特徴とする。この方法によれば、ホワイトボードの枠板に模様線が描かれていたり、文書のページ厚さの中に各ページの線が表出していたりして、これらの線分が直線候補として抽出されているような場合でも、最も中心側方向に近い位置に存在する直線が選択されることから前記直線候補は篩い落とされ、ホワイトボード枠部やページ厚さ部分を含まずに領域特定できる確率をより向上させることができる。
請求項3にかかる画像解析方法は、前記解析対象画像の中心側方向の所定値Kcが、0≦Kc≦0.15(但し、この数値は解析対象画像の辺方向の長さを1に正規化した値)の範囲に設定されることを特徴とする。この方法によれば、前記所定値Kcよりも画像の中心側に位置する直線候補は選択されなくなる。
請求項4にかかる画像解析方法は、前記第1領域及び第2領域は、解析対象画像を上下半分若しくは左右半分に分割して設定されることを特徴とする。この方法によれば、四方形のホワイドボード等が被写体画像として含まれている画像を解析する場合において、その上辺及び下辺、若しくは右辺及び左辺を、ハフ変換投票処理により抽出し易くなる。
請求項5にかかる画像解析方法は、前記累積度数最大直線により四方形の領域を画定し、該四方形領域の内側であって、各々の累積度数最大直線よりも所定値Kc以内に存在する4つの直線を第1辺〜第4辺として定めた四方形領域を特定領域として検出することを特徴とする。この方法によれば、四方形のホワイドボード等が被写体画像として含まれている画像を解析する場合において、その4辺を適正に検出できる(ホワイトボード枠部の4つの「内側辺」を確実に検出できる)ようになる。
請求項6にかかる画像解析方法は、解析対象画像からエッジを抽出してエッジ画像を作成すると共に、該エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求め、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を複数抽出し、この抽出された直線情報群の中から、解析対象画像の第1領域内において解析対象画像の最も中心側方向に近い位置に存在する直線を検出して第1辺を求め、前記第1領域とは異なる第2領域内において同様にして第2辺を求め、少なくとも前記第1辺及び第2辺で区画される領域を特定領域として検出することを特徴とする。
この方法によれば、所定の直線候補を抽出した後、上述のように累積度数最大直線を求めることなく、第1領域内及び第2領域内において最も中心側方向に近い位置に存在する直線を第1辺及び第2辺として抽出するので、簡略化した処理により特定領域を画定する前記第1辺及び第2辺を検出することができる。
請求項7にかかる画像処理方法は、処理対象となる画像情報を取得し、前記画像情報に対して請求項1〜6のいずれかの画像解析方法に基づいて特定領域を検出して抽出する処理を行い、当該抽出された特定領域に対応する画像情報に対して、所定の画像処理を実行することを特徴とする。この方法によれば、取得(入力)された画像情報のうち、上述の画像解析方法にて切り出された特定領域の画像に対して、あおり補正や下地とばし処理などの所定の画像処理を施すことができる。すなわち、当該画像処理を実行するに際し、最適な画像を切り出した上での処理を実行することができる。
請求項8にかかる画像解析装置は、解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成手段と、前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出手段と、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出手段と、抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出手段と、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定手段と、前記辺選定手段により検出された2以上の辺により区画される領域を特定領域として検出する領域検出手段とを具備することを特徴とする。
この構成によれば、エッジ画像作成手段によりエッジ画像が作成され、直線検出手段及び度数検出手段により、検出すべき特定領域を画定する直線候補が抽出され、累積度数最大直線手段により特定される累積度数最大直線に近接している所定の直線が、辺選定手段により特定領域を画定する直線(辺)として選定されるようになる。従って、ホワイトボード枠部の「内側辺」に相当する直線や、ページ厚さがある文書の最上面文書の輪郭線を、特定領域を画定する直線として検出できるようになる。
請求項9にかかる画像処理システムは、請求項8に記載の画像解析装置と、前記画像解析装置に対して被解析対象画像を入力する画像入力装置と、前記画像解析装置の領域検出手段により検出された特定領域に対応する画像情報に対して、所定の画像処理を行う画像処理装置とを具備することを特徴とする。この画像処理システムによれば、画像入力装置から入力された画像情報から、上述の画像解析装置にて切り出された特定領域の画像に対して、あおり補正や下地とばし処理などの所定の画像処理を施すことができる。すなわち、当該画像処理を実行するに際し、最適な画像を切り出した上での処理を実行することができる。
請求項10にかかる画像解析プログラムは、コンピュータに画像解析処理を実行させるプログラムであって、解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成ステップと、前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出ステップと、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出ステップと、前記直線検出ステップで抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出ステップと、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定ステップと、前記辺選定ステップにより検出された2以上の辺により区画される領域を特定領域として検出する領域検出ステップとを含むステップを実行させるためのものである。
請求項11にかかる画像処理プログラムは、コンピュータに画像処理を実行させるプログラムであって、所定の画像入力装置から被解析対象画像を取得する画像取得ステップと、解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成ステップと、前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出ステップと、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出ステップと、前記直線検出ステップで抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出ステップと、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定ステップと、前記辺選定ステップにより検出された2以上の辺により区画される領域を特定領域として検出する領域検出ステップと検出された特定領域に対応する画像情報に対して、所定の画像処理を行う画像処理ステップとを含むステップを実行させるためのものである。
請求項1にかかる画像解析方法若しくは請求項10にかかる画像解析プログラムによれば、枠板を有するホワイトボードやページ厚さがある文書を被写体画像として含む画像を解析する場合でも、ホワイトボード枠部やページ厚さ部分を除外して特定領域を検出することが可能となる。従って、前記特定領域の画像(例えばホワイトボードのボード本体部分に対応する画像)に対して、所定の画像処理(例えばボード本体部分に描かれた文字、図形等の明瞭度を向上させる画像処理)を適正に行い易いような画像切り出しを的確に行うことができるという効果を奏する。
請求項2にかかる画像解析方法によれば、ホワイトボードの枠板に模様線が描かれていたり、文書のページ厚さの中に各ページの線が表出していたりする場合でも、これらに由来する直線情報を第1辺及び第2辺として誤検出することはなく、特定領域を一層適正に検出できるようになる。従って、その後にあおり補正や下地とばし処理等の画像処理を的確に行うことが可能となる。
請求項3にかかる画像解析方法によれば、前記所定値Kcよりも画像の中心側に位置する直線候補は選択されなくなることから、例えばホワイトボードのボード本体に表が描かれているように、誤検出を行い易いケースでも、特定領域を適正に検出することができる。
請求項4にかかる画像解析方法によれば、ハフ変換投票処理による直線検出を簡単且つ確実に行うことができる。従って、直線候補の抽出を一層確実に行えると共に、その後の処理も一層適正に行えるようになる。
請求項5にかかる画像解析方法によれば、四方形のホワイドボード等が被写体画像として含まれている画像を解析する場合において、その4辺を適正に検出できる(ホワイトボード枠部の4つの「内側辺」を確実に検出できる)ので、枠部を含まないホワイトボード領域を確実に検出でき、その後の画像処理において的確なあおり補正や下地とばし処理等を行えるようになる。
請求項6にかかる画像解析方法によれば、累積度数最大直線を求めることなく、簡略化した処理により特定領域を画定する前記第1辺及び第2辺を検出することができるので、処理の高速化を図ることが可能となる。
請求項7にかかる画像処理方法若しくは請求項11にかかる画像処理プログラムによれば、上述の画像解析方法にて切り出された特定領域の画像に対して、あおり補正や下地とばし処理などの所定の画像処理を施すことができる。すなわち、当該画像処理を実行するに際し、最適な画像を切り出した上での処理を実行することができるので、処理後の画像の見栄えが優れない、或いはゆがみ補正が不十分といったような不都合が生じないようにすることができる。
請求項8にかかる画像解析装置によれば、ホワイトボード枠部の「内側辺」に相当する直線や、ページ厚さがある文書の最上面文書の輪郭線を、特定領域を画定する直線として検出でき、従ってその後の画像処理を適正に行うことができる。
請求項9にかかる画像処理システムによれば、上述の画像解析装置にて切り出された特定領域の画像に対して、あおり補正や下地とばし処理などの所定の画像処理を施すことができる。すなわち、当該画像処理を実行するに際し、最適な画像を切り出した上での処理を実行することができるので、処理後の画像の見栄えが優れない、或いはゆがみ補正が不十分といったような不都合が生じないようにすることができる。
以下、図面に基づいて、本発明の具体的な実施形態につき説明する。
図1は、本発明の一実施形態にかかる画像処理システム1の構成を示すブロック図である。この画像処理システム1は、画像解析装置10、画像処理装置40、画像を取り込む画像入力装置としてのデジタルスチルカメラ50、画像を表示させるモニタ60及び処理済みの画像を出力するプリンタ70などを備えて構成されている。
前記画像解析装置10は、当該画像解析装置10全体の制御を行なうCPU(Central Processing Unit)等からなる制御部2と、ROM(Read Only Memory)31と、RAM(Random Access Memory)32と、HD(Hard Disc)33と、I/O(Input/Output;入出力部)34とを備え、制御部2が、オペレーションシステム、アプリケーション等のプログラムや、画像ファイル等のデータを格納するHD33或いはROM31から、格納されているプログラムやデータを読出し、RAM102上に展開して実行することによって、解析対象画像(デジタルスチルカメラ50から入力される画像)に対して、特定領域を検出する画像解析処理を実現する。
この画像解析装置10は、I/O34を介して、デジタルスチルカメラ50、モニタ60及びプリンタ70と交信する。例えば前記画像解析処理を実行される際、制御部2によりデジタルスチルカメラ50に保存されている画像データが読み出されたり、処理済みの画像を出力する際にプリンタ70に印刷データが送信されたりする。
また画像解析装置10には、画像処理装置40が接続されている。この画像処理装置40は、前記画像解析装置10により検出された特定領域の画像に対し、所定の画像処理を施与するためのものである。該画像処理装置40は、例えばR(赤)、G(緑)、B(青)の各デジタル信号に、黒レベルを基準化する黒レベル補正部、光源に応じた白基準に基づいてレベル変換を行うホワイトバランス調整部、ガンマ特性を補正するガンマ補正部などのほか、画像のゆがみを補正するあおり補正部41、ホワイトボードの白地部分への色かぶりを補正する下地とばし処理部42が備えられている。
なお、このような画像解析装置10は、前記画像処理装置40を含んだ形で、一般的なパーソナルコンピュータ等で構築することができる。或いは、デジタルスチルカメラ50の内部にこの実施形態にかかる画像解析装置10を内蔵させ、当該デジタルスチルカメラ50に備えられている画像処理部とリンクさせて処理を行うような画像処理システム1とすることもできる。
図2は、前記画像処理システム1により画像処理される解析対象画像S(画像解析装置10への入力画像)と、処理後の画像の例を示す図である。図2(a)は、枠板付きの四方形状ホワイトボードを被写体画像として含む解析対象画像Sを示しており、この画像Sには白地領域であるホワイトボード領域9、前記枠板に対応する枠部90、及びホワイトボード領域9に描かれた文字情報91が含まれている。なおこの画像Sは、ホワイトボードに向かって左方向から撮影され、左側が比較的大きいようにゆがんだ状態(あおりが有る状態)で画像記録されている場合を例示している。
図2(b)は、画像解析装置10により特定領域検出処理を行った結果、ホワイトボード枠部90の4つの内側辺に相当する包囲直線92(第1辺〜第4辺を画定する4つの直線)、つまり特定領域として検出すべきホワイトボード領域9を画定する辺が検出され、この包囲直線92が解析対象画像S上に重畳表示されている状態を示している。
そして図2(c)は、包囲直線92にて区画された領域の画像、つまり特定領域の画像を取り出し、あおり補正と下地とばし処理とを行った状態を示している。すなわち、画像処理装置40のあおり補正部41により、検出された特定領域の形状(この場合、左側が比較的大きいようにゆがんだ形状)に基づいてあおり度合いが求められ、あおりの無い状態の画像データに変換される。また、下地とばし処理部42により、文字情報91を読みやすくするために、白地領域が白(例えば8bitデータでの諧調が255)となるように下地とばし処理が行われる。これにより文字情報91は、あおりが解消され、また明瞭化された状態の画像92aとして画像記録、画像表示或いは画像印刷されるものである。以下、上記図2(b)に示したような、画像解析装置10による特定領域検出の手法に重点を置いて説明する。
図3は、画像解析装置10の制御部2の機能を説明するための機能ブロック図である。この制御部2は、操作信号受信部201、輝度データ変換部202、画像縮小処理部203、諧調補正処理部204、ノイズ除去部205、エッジ画像生成部206、ヒストグラム生成部207、2値化処理部208、分割画像設定部209、直線検出部210、度数/傾き検出部211、度数判定部212、辺選定部213及び領域検出部214を備えている。
操作信号受信部201は、前記画像解析装置10に対する処理指令信号を受信し、解析対象となる画像(入力画像)に対して各部に処理の実行を開始させる。当該画像解析装置10がパーソナルコンピュータにて構成されている場合、マウス等(操作部)により与えられる処理指令信号を受信することになる。
輝度データ変換部202は、R(赤)、G(緑)、B(青)の各デジタル信号を、輝度データに変換する。
画像縮小処理部203は、処理速度を向上させるため、解像度変換により画像サイズを縮小する。具体的には、ニアレストネイバー法やバイリニア法等を用いた解像度変換処理を行い、縦横1/2や、縦横1/4等に画像を縮小変換する。
諧調補正処理部204は、前記画像縮小処理部23により生成された縮小変換画像の諧調の正規化を行い、露出レベルを補正する。すなわち、当該縮小変換画像中における最大輝度及び最低輝度が、諧調レベルでそれぞれ(255,0)となるように、全画素に対して諧調補正を行う(8bitデータの場合。以下同じ)。具体的には、入力画像の色情報であるRGB値から、次式に基づいて各々の画素ごとにY画像内の最大値Ymaxと最小値Yminとを算出する。
Y=0.3R+0.6G+0.1B
そして、算出された最大値Ymaxと最小値Yminとを用いて、次式に基づいて画素値の正規化を行う。
Rnew=255×(Rold−Ymin)/(Ymax−Ymin)
Gnew=255×(Gold−Ymin)/(Ymax−Ymin)
Bnew=255×(Bold−Ymin)/(Ymax−Ymin)
ただし、上述の正規化において、RGB値が0未満である場合には0となるように、256以上である場合には255となるように補正することが必要である。このような諧調の正規化を行うことで、どのような露出条件で撮影された画像であっても、一律な処理を行うことが可能となる。
ノイズ除去部205は、画像中に含まれている孤立的に高輝度若しくは低輝度の画素信号を除去する。このようなノイズ除去処理の手法としては、平滑化処理、メディアンやモルフォロジ処理(最大値・最小値フィルタ処理)等のフィルタ演算処理等を採用することができる。かかるノイズ除去部を設けるのは、後段のエッジ抽出処理において、ノイズの影響を受けずにより正確にエッジのみを抽出するためである。
エッジ画像生成部206は、諧調変換処理及びノイズ除去処理等の前処理が行われた入力画像の中から、例えばホワイトボードの枠部や原稿端など、被写体画像のうち文書領域等(本画像解析装置10にて検出する特定領域)を区画する直線部分に対応する輝度配列部分であるエッジ(画像の中で急激に明るさが変化している部分)を抽出し、エッジ画像を生成する。このようなエッジ抽出には、例えばソーベルフィルタを用いることができる。
図4は、ソーベルフィルタの一例を示す説明図である。このソーベルフィルタは、画像から輪郭を抽出する時に用いられるフィルタであって、1次微分をする時に注目画素の近傍の画素に重み付けをするフィルタである。検出すべき特定領域が矩形状である場合において、その垂直エッジ(右辺と左辺)を検出するときには、例えば図4(a)に示すような水平方向重み付けフィルタが用いられる。すなわち、3×3画素群においてその中央を注目画素Pとするとき、注目画素Pと同じ縦列の画素B、Pの重みを0,左側の縦列画素A、D、Fの重みを各々−1、−2,−1、右側の縦列画素C、E、Hの重みを各々1、2、1としたフィルタを用いることができる。このようなフィルタを用いると、水平方向の明るさの変化が大きい部分が検出されることから、結果を画像として表示すると縦ライン(垂直エッジ)が検出されるようになる。
一方、水平エッジ(上辺と下辺)を検出するときには、例えば図4(b)に示すような垂直方向重み付けフィルタが用いられる。すなわち、3×3画素群においてその中央を注目画素Pとするとき、注目画素Pと同じ横列の画素D、Eの重みを0,上列画素A、B、Cの重みを各々−1、−2,−1、下列画素F、G、Hの重みを各々1、2、1としたフィルタである。このようなフィルタを用いると、垂直方向の明るさの変化が大きい部分が検出されることから、結果を画像として表示すると横ライン(水平エッジ)が検出されるようになる。
このような水平エッジ度Ehおよび垂直エッジ度Evは、エッジ画像が図4に示すような各画素A〜H,Pを含む画像であって、画素Pを注目する画素とする場合、各々の画素値をa〜h,pとすると、次式で表わされる。
Eh=max(|2p−a−h|,|2p−b−g|,|2p−c−f|)
−min(|2p−a−h|,|2p−d−e|,|2p−c−f|)
Ev=max(|2p−a−h|,|2p−d−e|,|2p−c−f|)
−min(|2p−a−h|,|2p−b−g|,|2p−c−f|)
ヒストグラム生成部207は、解析対象となる画像を構成する画素における輝度Yのヒストグラムを作成する。すなわち、横軸を輝度Y、縦軸を画素数Nとする輝度Yの度数分布を求めるものである。
2値化処理部208は、解析対象画像に含まれる本来的なエッジのみを抽出できるように、所定の輝度閾値(以下、「閾値Yth」という)を用いて輝度Yのデータを2値化する。つまり、所定の値の閾値Ythを決定し、Y<YthであればY=0とし、Y≧YthであればY=255として、輝度Yのデータを2値化する。
上記閾値Ythは、例えばヒストグラム生成部207にて作成されるヒストグラムに基づいて求めることができる。図5は、ヒストグラムから閾値Ythを求める方法の一例を示すグラフ図である。この例では、ヒストグラムの高輝度側から輝度度数のサーチを行い、度数がピークとなる輝度レベルYmaxにおける度数Vmaxを求め、前記ピーク輝度レベルYmaxからさらに低輝度側へサーチを行い、度数がVmaxの1/4となる輝度レベルを検出し、当該輝度レベルを閾値Ythとしている。ヒストグラムの高輝度側ピーク(輝度レベルYmax付近)では、本来エッジでない領域のノイズがエッジとして抽出されてしまっているものである。従って、ヒストグラムの高輝度側ピークからある程度高輝度側に離れた裾野部分に相当する輝度(Vmaxの1/4の輝度)を閾値Ythと決定することで、本来のエッジのみが抽出できるようになるものである。
分割画像設定部209は、上記エッジ画像が少なくとも第1領域の画像と第2領域の画像とに分割されるように画像情報取得エリアを設定する。この画像分割の態様は被写体画像に応じて適宜設定可能であるが、同方向の辺が複数(2つ)存在している場合は、誤検出を防止するために、これらの辺(第1辺及び第2辺)に由来するエッジ画像が別々に含まれるよう、画像情報取得エリアを設定することが望ましい。
例えばホワイトボードのような 四角形的な被写体画像を含む解析対象画像である場合、前記第1領域及び第2領域は、解析対象画像を上下半分若しくは左右半分に分割して設定されることが望ましい。図6(a)は、横長のホワイトボード領域9を含む被写体画像Sを、上下半分に分割して第1領域9a及び第2領域9bを設定した状態を示している。この場合、ホワイトボード枠部における水平方向の直線の一方(上辺90−h1)が第1領域9aに含まれ、また水平方向の直線の他方(下辺90−h2)が第2領域9bに含まれることとなる。従って、ホワイトボード枠部の上辺90−h1及び下辺90−h2に由来するエッジ画像に基づいてそれぞれ直線を抽出する場合に、2つの対向辺が同一画像中に存在することに伴う誤検出を生じないようにすることができる。
また図6(b)は、同じ被写体画像Sを、左右半分に分割して第3領域9c及び第4領域9dを設定した状態を示している。この場合、ホワイトボード枠部における垂直方向の直線の一方(左辺90−v1)が第3領域9cに含まれ、また垂直方向の直線の他方(右辺90−v2)が第4領域9dに含まれることとなる。従って、ホワイトボード枠部の左辺90−v1及び右辺90−v2に由来するエッジ画像に基づいてそれぞれ直線を抽出する場合に、2つの対向辺が同一画像中に存在することに伴う誤検出を生じないようにすることができる。
このような分割画像設定部209による画像情報取得エリアの設定動作は、検出すべき直線情報に応じて適宜変更しながら行うことが望ましい。例えば、先ず解析対象画像Sを図6(a)に示すように上下半分に画像Sを分割し、その分割エッジ画像に基づいて水平方向の直線情報を検出した後、続いて図6(b)に示すように左右半分に画像Sを分割し、その分割エッジ画像に基づいて垂直方向の直線情報を検出するというシーケンス動作を行わせることが望ましい。
直線検出部210は、エッジ画像を構成する画素についてハフ(hough)変換投票処理を行って傾き−切片座標データを求める。つまり、前記各画像情報取得エリアのそれぞれにおいて、分割エッジ画像に基づき複数の直線情報を検出する。ハフ変換は、直線、円、楕円といったパラメトリックな図形の特徴抽出法であって、例えば直線を抽出する場合であれば、パラメータとして傾きLと切片Cを考慮し、x−y平面上の点を、傾きL−切片C座標平面上へ、点から線への変換を行うものである。このようなハフ変換投票処理は、前記2値化処理部208による2値化処理によって、Y=255に変換された画素(エッジ画素)のみについて行われる。
具体的には、ハフ変換投票処理対象となるエッジ画素(X,Y)について、傾きL及び切片Cをある程度限定した組合せを選択した上で、当該エッジ画素(X,Y)を通る全ての直線の傾きL及び切片Cを求め、傾きL−切片C座標上にポイント加算する。すなわち、選択されたあらゆる組合せに対して、次式の計算を行う。
E=|Y−(LX+C)|
そして、所定の固定しきい値Thdについて、E<Thdを満す組合せ(L,C)に対して、ポイントを加算(投票)する。
図7は、このようなハフ変換投票処理をグラフ図として表したものである。つまり、図7(a)に示すようなエッジ画素(X,Y)について、当該エッジ画素(X,Y)を通る全ての直線Iの傾きL及び切片Cを求め、ハフ変換投票処理を行うと、図7(b)に示すように、傾きL−切片C座標平面上において直線Jとなる変換が行われる。ここで、図7(a)に示すように、切片Cはエッジ画素(X,Y)を通る直線Iが画面と交わる点におけるy値である。また傾きLは、水平線Hに対する傾き角度をθとしたときにおけるtanθの値である。
ここで、図8(a)に示すように、ある直線I0上に存在するエッジ画素(X1,Y1)〜(X4,Y4)全てについて、上述したようなハフ変換投票処理を行って直線J1〜J4にそれぞれ変換し、これを同じ傾きL−切片C座標平面上に描くと、図8(b)に示すように直線J1〜J4が、ある一点(交差点K)で交差するようになる。この交差点Kは、傾きL−切片C座標において度数(ポイント累積度数)が最も大きくなる点であり、当該交差点Kにおける傾きL及び切片Cが、図8(a)に示す直線I0の傾きL及び切片Cとなるものである。
直線検出部210は、このような原理に基づいて、2値化処理部208による2値化処理によってY=255に変換されたエッジ画素の全てについて、ハフ変換投票処理を行って図7(a)に示すような直線Jをそれぞれ求め、これらを図8(b)に示すように、傾きL−切片C座標平面に展開して直線J群の交差する回数の多い点(交差点K)を検出する。そして、かかる交差点Kにおける傾きL及び切片Cを求めることにより直線情報を検出する。なお、このハフ変換投票処理は、分割画像設定部209により設定された例えば図6に示す第1領域9a及び第2領域9b(水平方向の直線検出時)、或いは第3領域9c及び第4領域9dのそれぞれにおいて実行される。
上記のようなハフ変換投票処理では、第1領域9a〜第4領域9dのそれぞれにおいて、その画像(分割画像)中に含まれるエッジ画像に基づき直線情報を検出することから、さまざまなエッジに基づく直線情報が検出され得る。つまり、前記傾きL−切片C座標において、周辺よりも累積度数が高い交差点があれば、直線情報として抽出される。従って、例えばホワイトボードの枠板に由来する直線情報は勿論のこと、背景画像に含まれる直線的な被写体やボード本体の白地部分に描かれた図表のラインに由来する直線情報も検出され得る。直線検出部210は、これら諸々の直線情報の検出動作を行い、度数検出部210に検出された直線情報を入力する。
度数/傾き検出部211は、直線検出部210により検出された直線情報の中から、傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出することで、検出すべき特定領域を区画する直線の候補を検出する。また度数判定部212(累積度数最大直線抽出手段)は、直線検出部209により検出された直線情報の中から、解析対象画像の領域毎に、前記傾き−切片座標における累積度数が最大となる直線情報(累積度数最大直線)を求める(以下、この累積度数最大直線の傾きをLm、切片をCm、累積度数をVmという)。
なお、前記累積度数最大直線はエッジ度の高いエッジ画像に起因する直線であり、かような直線は、ホワイトボードを撮影して画像解析しようとする意図に基づき撮影された画像の場合、通常はホワイトボードの枠板に由来する直線である可能性が極めて高いと言える。従って、度数判定部212にて抽出される累積度数最大直線は、少なくとも最終的に検出すべき特定領域を区画する直線(ホワイトボード枠部90の内側辺)と近い位置にある直線と評価することができる。
前記度数/傾き検出部211は、具体的にはノイズ的な直線をも含んでいる可能性が高い前記直線検出部210により検出された直線情報に対し、(イ)傾き−切片座標における累積度数と、(ロ)傾きとの2つのパラメータをそれぞれの直線情報につき算出することで、検出された直線に対して絞りを加えるための情報を求める。
上記(イ)傾き−切片座標における累積度数については、所定の度数閾値Vthを定め、検出された直線情報のそれぞれがこの閾値Vthを超過するか否かが前記度数/傾き検出部211にて判定される。このため、度数/傾き検出部211には、所定の度数閾値Vth情報が与えられる。かかる度数閾値Vth情報は、例えば前記累積度数最大直線の累積度数Vmを基準に所定の係数Kvを乗じた値に設定することができる。例えば、
度数閾値Vth=Vm×Kv(但しKv=0.5)
との演算式をROM31等に格納しておき、該演算式で求められた度数閾値Vthと、検出された各直線情報の累積度数を比較演算することで、特定領域を区画する直線候補として残存させるかを判定させることができる。このような判定を行い、直線検出部210で検出された直線情報に篩をかけることにより、短い直線や途切れた直線が検出されなくなり、ボード本体に描かれた文字情報91の連なり部分に由来する直線等を誤検出するのを防止することができる。
また、上記(ロ)傾きについては、所定の傾き範囲Lth1〜Lth2を定め、検出された直線情報のそれぞれがこの傾き範囲Lth1〜Lth2の範囲内にあるかが度数/傾き検出部211にて判定される。このため、度数/傾き検出部211には、所定の傾き範囲Lth1〜Lth2についての情報も与えられる。かかる傾き範囲情報は、例えば前記累積度数最大直線の傾きLmを基準に所定の係数Klを増減した範囲に設定することができる。例えば、
傾き範囲(上限)Lth1=Lm−Kl(但しKl=tan10°)
傾き範囲(下限)Lth2=Lm+Kl(但しKl=tan10°)
との演算式をROM31等に格納しておき、該演算式で求められた所定の傾き範囲Lth1〜Lth2と、検出された各直線情報の傾きとを比較演算することで、特定領域を区画する直線候補として残存させるかを判定させることができる。このような判定を行うことで、累積度数最大直線とほぼ平行な直線のみが候補として残存することとなる。
図9及び図10は、前記度数/傾き検出部211による直線候補選定結果を模式的に示す図である。図9(a)は、図6(a)に示した画面上半分の第1領域9aに相当するエッジ画像について、上記度数閾値Vthによる絞りを加えた状態を示している。すなわち、この第1領域9aには、ホワイトボード枠部90の上辺90−h1が存在しており、この場合前記上辺90−h1の外側辺及び内側辺にそれぞれ由来するエッジが強く、このエッジ画像に基づく直線h11,h12のいずれかが累積度数最大直線である可能性が高い。図9(b)は、直線h11,h12の傾き−切片座標データを示し、ここでは直線h11を導く交差点K11が、傾きLm、切片Cmを有する累積度数最大直線である場合を示している。このような環境で度数閾値Vthを用いた上記演算を実行した場合、直線候補として抽出されるのは、直線h11には満たないまでも良く似た累積度数を有するであろう交差点K12から導出される直線h12(傾きLi、切片Ci)であると言える。図9は、このような一例を示すものである。
図10は、第1領域9aに相当するエッジ画像について、上記傾き範囲Lth1〜Lth2による絞りを加える状態を説明する図である。この場合、累積度数最大直線である直線h11の傾きLm(傾斜角θ1)を基準にして傾き範囲Lth1〜Lth2に相当する傾斜角範囲θthが定められ、直線h12の傾き傾きLi(傾斜角θ2)が前記傾斜角範囲θthに収まるものであるか(θth>|θ1−θ2|ならば範囲内)が判定されることなる。上記のような直線h11,h12は、上辺90−h1の外側辺及び内側辺に由来するものであるから、両者はほぼ平行な直線であり、上記傾き範囲による絞りもクリアすることになる。
図2に戻って、辺選定部213は、前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する。例えば画面上半分の第1領域9aの場合、画像中心により近い画面下側方向において、前記累積度数最大直線から所定値Kc以内に存在する直線を検出する。具体的には、所定の切片範囲Cth1〜Cth2を定め、検出された直線情報のそれぞれの切片がこの切片範囲Cth1〜Cth2の範囲内にあるかを、辺選定部213にて判定するよう構成することができる。
この場合、切片範囲Cth1〜Cth2は、例えば前記累積度数最大直線の切片Cmを基準に所定の係数Kcを加えた範囲に設定することができる。例えば、
切片範囲ゼロ点Cth1=Cm
切片範囲上限点Cth2=Cm+Kc
(但し、Kc=画面のx又はy方向のサイズ×0.1)
との演算式をROM31等に格納しておき、該演算式で求められた所定の切片範囲Cth1〜Cth2と、検出された各直線情報の切片とを比較演算することで、特定領域を区画する直線候補として残存させるかを判定するよう構成することができる。
このような判定を行うことで、累積度数最大直線よりも画面外側において検出されている直線が先ず除外され、さらに累積度数最大直線より画面内側であっても、累積度数最大直線から位置が離れすぎている直線(例えば図10に示した直線h1)の如きも除外されるようになる。従って、ホワイトボード枠外の直線や、ボード本体に描かれた図表の直線を誤検出されるのを防止することができる。なお、前記所定値Kcは、0≦Kc≦0.15(但し、この数値は解析対象画像Sの辺方向の長さを1に正規化した値)程度の範囲で選択することが望ましい。
上記辺選定部213は、累積度数最大直線よりも解析対象画像の中心側方向の所定距離以内に存在する直線が複数存在する場合に、最も中心側方向に近い位置に存在する直線を選択する選択機能を具備することが望ましい。このような選択機能を具備していれば、ホワイトボードの枠板に模様線が描かれているような場合等であって、その線分が直線候補として抽出されているような場合でも、最も中心側方向に近い位置に存在する直線が選択されることから前記直線候補は篩い落とされ、ホワイトボード枠部を含まずに領域特定できる確率をより向上させることができるようになる。
以上説明したような直線候補の検出が、ホワイトボードの場合はその4辺について行われる。図11は、その直線候補検出の状態を模式的に示す図である。例えば図11(a)に示すように、ホワイトボード枠部90の上辺90−h1と下辺90−h2については、図6(a)に示す第1領域9a及び第2領域9bのそれぞれにおいて直線検出部210で検出された直線に対し、前記度数/傾き判定部211及び度数判定部212による処理を与えることで、上辺90−h1の外側辺及び内側辺に対応する直線h11及びh12と、下辺90−h2の外側辺及び内側辺に対応する直線h21及びh22とが検出される。
また、図11(b)に示すように、ホワイトボード枠部90の左辺90−v1と右辺90−v2については、図6(b)に示す第3領域9c及び第4領域9dのそれぞれにおいて直線検出部210で検出された直線に対し、前記度数/傾き判定部211及び度数判定部212による処理を与えることで、左辺90−v1の外側辺及び内側辺に対応する直線v11及びv12と、右辺90−v2の外側辺及び内側辺に対応する直線v21及びv22とが検出される。図12は、このようにして検出された直線を合成した図である。
そして辺選定部213により、累積度数最大直線より画面内側にある所定の直線が選定されることから、結果的にホワイトボードにおいて特定領域を検出する場合に最も望ましいホワイトボード枠部90の「内側辺」に対応する直線候補である直線h12、h22、v12、v22(第1辺〜第4辺)が選定されるようになる。なお、前記累積度数最大直線よりも画像の中心側に該当する直線候補が存在しない場合は、この累積度数最大直線がホワイトボード枠部の「内側辺」として検出されている可能性が高いので、これを第1辺〜第4辺として特定すればよい。このような直線検出処理の中間結果並びに最終結果は、例えばRAM32等に一時的に格納される。
領域検出部214は、辺選定部213により検出された上記直線h12、h22、v12、v22(第1辺〜第4辺)により区画される領域(図12に示す矩形領域R)を、特定領域として検出する。このような矩形領域Rは、ホワイトボード枠部の4つの「内側辺」を結んで画定される領域であることから、あおり補正や下地とばし処理等の画像処理に最適な矩形の特定領域となるものである。
以上の通り構成された制御部2を備える画像解析装置10によれば、枠板を有するホワイトボードやページ厚さがある文書を被写体画像として含む画像を解析する場合でも、ホワイトボード枠部やページ厚さ部分を除外して特定領域を検出することが可能となり、正確に画像処理に適した矩形画像を特定領域として検出できるようになる。
このようにして画像解析装置10により検出された特定領域(ホワイトボードの白板面)に対応する画像情報は、画像処理装置40にて抽出される。そして、前記あおり補正部41により画像のゆがみを補正され、また下地とばし処理部42によりホワイトボードの白地部分への色かぶりを補正される等、ホワイトボードに描かれた文字・図形情報を明瞭化するための画像処理が行われる。
画像処理装置40にて画像処理された画像情報は、画像解析装置10に備えられているROM31やHD33に格納されたり、モニタ60上に表示されたり、或いはプリンタ70により紙出力されたりして、ユーザの利用に供されることとなるものである。
次に、本実施形態にかかる画像処理システム1による画像処理(画像解析処理)の手順について説明する。図13は、画像処理方法の全体的な手順を示すフローチャートであり、以下図2に示すように枠板を有する矩形状のホワイトボードを被写体画像として含む解析対象画像を処理する場合について説明する。
この画像処理は、画像処理システム1がパーソナルコンピュータ等を用いて構築されている場合、ユーザがマウス(操作部)で画像解析処理の開始指令を与え、かかる開始指令信号を制御部2の操作信号受信部201が受信し、ROM31若しくはHD33に格納されている本実施形態にかかる画像解析処理(画像処理)プログラムを起動されることで開始される。
先ず、解析対象となる画像が、画像解析装置10に入力される(ステップS11)。本実施形態では、画像入力装置として機能するデジタルスチルカメラ50から、ホワイトボードを被写体画像として含む記録画像が、I/O34を介して制御部2(RAM32)へ取り込まれる。なお、この画像入力の手法は任意であり、例えば予めデジタルスチルカメラ50からROM31へ画像を転送しておいたものを読み出したり、記録メディアに格納されている画像ファイルを読み出したりするようにしても良い。
次に、入力された画像に対して、諧調データ変換部202により、R、G、Bの各デジタル信号を輝度データに変換する処理が実行される(ステップS12)。これに続き、処理速度を向上させるため、画像縮小処理部203により縮小画像が作成される(ステップS13)。
さらに、諧調補正処理部203により、ステップS3で作成された縮小画像に対して諧調の正規化処理が行われる(ステップS14)。すなわち、前記縮小画像中における最大輝度及び最低輝度が、諧調レベルでそれぞれ(255,0)となるように、全画素に対して諧調補正が行われる。そして、ノイズ除去部205により、諧調補正後の画像に対してノイズ除去処理が実行される(ステップS15)。
以上のような前処理が解析対象画像に施された後、エッジ画像生成部206により、当該解析対象画像から抽出対象とされる被写体画像(ホワイトボードの輪郭である四角形的な被写体画像)に由来するエッジ画像が生成される(ステップS16)。対象となる被写体画像がホワイトボードであるので、ソーベルフィルタによりフィルタリング処理により、ホワイトボードの外枠の四辺が強調された四角形的なエッジ画像が生成されることとなる。ただ、この時点では検出すべき本来的なエッジ以外の画素もエッジとして抽出されている場合がある。しかる後、ヒストグラム生成部207により、解析対象となる画像を構成する画素における輝度Yのヒストグラムが作成される(ステップS17)。
これに続き、解析対象画像に含まれる本来的なエッジのみを抽出できるように、2値化処理部208により、例えばヒストグラム生成部207にて作成されたヒストグラムに基づき定められた所定の閾値Ythを設定して、Y<YthであればY=0とし、Y≧YthであればY=255として、輝度Yのデータを2値化する処理が実行される(ステップS18)。ここまでの処理により、例えば図2(a)に示すように、画像中におけるホワイトボード領域9の枠部90(輝度が画像中の他の部分と比べて水平方向及び垂直方向に異なるためエッジとして抽出された部分)に対応する画素(Y=255の画素)のみが強調された四角形的なエッジ画像が生成されることとなる。
次に、分割画像設定部209により、例えば図6に示すように、分割された画像情報取得エリア(第1領域〜第4領域9a〜9d)が設定され、直線検出部210により、各画像情報取得エリアの分割エッジ画像それぞれにおいて、2値化処理部208にてY=255の画素に変換されている全ての画素についてハフ変換投票処理が実行され、エッジ画像に基づく直線情報が検出される(ステップS19)。そして、後述の図14に示すフローチャートで詳述する通り、度数/傾き検出部211、度数判定部212及び辺選定部213により、検出すべき特定領域を区画する直線(第1辺〜第4辺)が検出される。つまり、例えば図12に示す直線h12、h22、v12、v22のような、特定領域端のエッジが決定される(ステップS20)。
図14は、特定領域端のエッジを決定する処理(図13のフローチャートにおけるステップS20)の詳細手順を示すフローチャートである。先ず、度数判定部212により、直線検出部210にて検出された直線情報(上述のステップS18)の中から、解析対象画像の領域毎に、前記傾き−切片座標における累積度数が最大となる累積度数最大直線(傾きLm、切片Cm、累積度数Vm)が求められる(ステップS21)。
続いて、直線検出部210により検出された直線情報について、前記累積度数最大直線の傾きLm、切片Cm、累積度数Vmを基準として、検出すべき特定領域を区画する直線候補の抽出、選定が実行される。先ず、傾き−切片座標において周辺よりも所定量累積度数の高い直線情報かが確認される(ステップS22)。なお、前記ステップS22は、直線検出部210にて直線情報として検出する際に、予め実行しておいても良い。
累積度数の高い直線情報であれば(ステップS22でYes)、度数/傾き検出部211により、その直線情報の累積度数Viが所定の度数閾値Vth以上であるかが確認される(ステップS23)。該直線情報が度数閾値Vth以上の累積度数Viを有している場合(ステップS23でYes)、度数/傾き検出部211により、その直線情報の傾きLiが所定の傾き範囲Lth1〜Lth2の範囲内であるかが確認される(ステップS24)。
そして該直線情報の傾きLiが、所定の傾き範囲Lth1〜Lth2の範囲内である場合(ステップS24でYes)、辺選定部213により、その直線情報の切片Ciが所定の切片範囲Cth1〜Cth2の範囲内であるかが確認される(ステップS25)。直線情報の切片Ciが所定の切片範囲Cth1〜Cth2の範囲内である場合(ステップS25でYes)、このような傾きLi及び切片Ciを備える直線情報は、特定領域を区画する直線の候補として選定され、RAM32等に一時的に格納される(ステップS26)。
しかる後、全てのエッジ画素について判定が完了したかが確認され(ステップS27)、未確認の場合(ステップS27でNo)は、ステップS22に戻って同様な処理が繰り返される。なお、上記各ステップにおいて、累積度数、傾き及び切片の条件のいずれかを満たさなかった場合(ステップS22〜ステップ25のいずれか1つでNo)、このステップS27へ移行する。
全てのエッジ画素について判定が完了したら(ステップS24でYes)、辺選定部213は、RAM32等に一時的に格納した全ての直線候補(傾きLi、切片Ci、累積度数Vi)及び累積度数最大直線(傾きLm、切片Cm、累積度数Vm)の中から、最も画面の内側の直線(解析対象画像の中心側に近い直線)を選定し、その要件を満たす直線をホワイトボード領域9のエッジを構成する辺(第1辺〜第4辺)として決定する(ステップS28)。例えば図12に示す例の場合は、直線h12、h22、v12、v22を第1辺〜第4辺として決定するものである。
図13のフローチャートに戻って、その後、領域検出部214により、前記直線h12、h22、v12、v22で区画される矩形領域Rを作出し、当該矩形領域Rが特定領域として検出される(ステップS31)。前記矩形領域Rは、累積度数、傾き及び切片について所定の選定処理がなされた上で抽出された直線に基づき画定されたものであることから、ホワイトボードの枠板が含まれている状態で画像記録されていても、その画像において枠部90を含むことのない最適な矩形画像として特定領域を検出できるものである。
このようにして画像解析装置10により検出された特定領域(ホワイトボードの白板面)に対応する画像情報は、画像処理装置40にて抽出され、所定の画像処理が施される(ステップS32)。すなわち、あおり補正部41により画像のゆがみを補正され、また下地とばし処理部42によりホワイトボードの白地部分への色かぶりを補正される等、ホワイトボードに描かれた文字・図形情報を明瞭化するための画像処理が行われ、処理が終了する。この画像処理にあたり、領域検出部214にて抽出された特定領域にはホワイトボードの枠部や背景などは含まれていないことから、画像処理の品質を高めることができ、ホワイトボードに描かれた文字や図形を明瞭に再生することができる。
以上、本発明の一実施形態にかかる画像処理システム1につき説明したが、本発明はこれに限定されるものではなく、様々な変形実施形態を採ることができる。例えば、本実施形態では四角形状のホワイトボードを被写体画像とした場合について説明したが、三角形、五角形若しくはそれ以上の多角形を対象とすることもできる。また、ページ厚さを要する文字等が記載された原稿、図形や写真が描かれた用紙、或いは見開いた書籍なども被写体画像とすることもできる。この場合、それぞれの辺を別々に含むよう、複数の画像情報取得エリアを設定し、各々の分割エッジ画像から直線候補を抽出し、上記と同様な方法で辺を特定するようにすれば良い。
また、上記実施形態では、累積度数最大直線を求め、該直線を基準として度数閾値Vth、所定の傾き範囲Lth1〜Lth2及び所定の切片範囲Cth1〜Cth2を設定し、直線を選出する方法について説明したが、これらを予め固定値として設定する方式としても良い。
さらに、累積度数最大直線を求めずに特定領域を求めるようにしても良い。すなわち、解析対象画像からエッジを抽出してエッジ画像を作成すると共に、該エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求め、前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を複数抽出し、この抽出された直線情報群の中から、解析対象画像の第1領域内において解析対象画像の最も中心側方向に近い位置に存在する直線を検出して第1辺を求め、前記第1領域とは異なる第2領域内において同様にして第2辺を求め、少なくとも前記第1辺及び第2辺で区画される領域を特定領域として検出する構成とすることもできる。
具体的には、度数閾値Vth、所定の傾き範囲Lth1〜Lth2及び所定の切片範囲Cth1〜Cth2を所定の条件範囲に予め定めておき、例えば図6に示した第1領域〜第4領域9a〜9dにおいて前記条件を満たす直線候補を全て抽出する。各領域で抽出された直線群を合成すると、例えば図12に示すような直線候補区画が得られることとなる。そして、これら直線群のうち、解析対象画像の最も中心側方向に近い位置に存在する直線(図12の場合は、直線h12、h22、v12、v22)を4辺それぞれにおいて選出することにより、特定領域を画定するものである。
この方法によれば、所定の直線候補を抽出した後、上述のように累積度数最大直線を求めることなく、第1領域内及び第2領域内において最も中心側方向に近い位置に存在する直線を第1辺〜第4辺として抽出するので、簡略化した処理により特定領域を画定する前記第1辺〜第4辺を検出することができる。
さらに、上述の画像解析装置10が行う画像解析方法(或いは画像処理システム1が行う画像処理方法)を、プログラムとして提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM、ROM、RAMおよびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。若しくは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
本実施形態にかかる画像処理システムの構成を示すブロック図である。 (a)は上記画像処理システムにより画像処理される解析対象画像、(b)は特定領域検出処理が行われた状態を示す画像、(c)は画像処理後の画像の例をそれぞれ示す平面図である。 画像解析装置が備える制御部の機能ブロック図である。 ソーベルフィルタの一例を示す説明図であって、(a)は水平方向重み付けフィルタの例を、(b)垂直方向重み付けフィルタの例をそれぞれ示している。 エッジ抽出のために作成される輝度ヒストグラムの一例を示すグラフ図である。 抽出されたエッジ画像の分割状態を示す平面図であり、(a)は上下半分に分割した例、(b)は左右半分に分割した例をそれぞれ示す図である。 ハフ変換投票処理を説明するためのグラフ図である。 ハフ変換投票処理によって傾き及び切片を求め、直線を検出する処理を説明するためのグラフ図である。 度数/傾き検出部による直線候補選定結果を模式的に示す説明図である。 度数/傾き検出部による直線候補選定結果を模式的に示す説明図である。 辺選定部による直線候補選定の処理を説明するための説明図である。 辺選定部により直線候補選定の処理を説明するための説明図である。 本実施形態にかかる画像処理システムの動作を説明するためのフローチャートである。 本実施形態にかかるエッジ決定処理を説明するためのフローチャートである。 ページ厚さのある文書を撮影した画像から特定領域を抽出する処理を説明するための平面図である。 ホワイトボードを撮影した画像から特定領域を抽出する処理を説明するための平面図である。
符号の説明
1 画像処理システム
10 画像解析装置
2 制御部
206 エッジ画像生成部(エッジ画像作成手段)
207 ヒストグラム生成部
209 分割画像設定部
210 直線検出部(直線検出手段)
211 度数/傾き検出部(度数/傾き検出手段)
212 度数判定部(累積度数最大直線抽出手段)
213 辺選定部(辺選定手段)
214 領域検出部(領域検出手段)
40 画像処理装置
41 あおり補正部
42 下地とばし処理部
50 デジタルスチルカメラ(画像入力手段)
9 (解析対象画像中の)ホワイトボード領域
9a〜9d 第1領域〜第4領域
90 枠部
90a〜90d 第1〜第4の画像情報取得エリア
v11〜v22 垂直方向の直線
h11〜h22 水平方向の直線
R 矩形領域(特定領域)
S 解析対象画像

Claims (11)

  1. 解析対象画像からエッジを抽出してエッジ画像を作成すると共に、該エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求め、
    前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出すると共に、
    この抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求め、
    前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出して第1辺を求め、
    前記第1領域とは異なる第2領域内において同様にして第2辺を求め、
    少なくとも前記第1辺及び第2辺で区画される領域を特定領域として検出することを特徴とする画像解析方法。
  2. 前記累積度数最大直線よりも解析対象画像の中心側方向の所定距離以内に存在する直線が複数存在する場合に、最も中心側方向に近い位置に存在する直線を選択して前記第1辺若しくは第2辺として定めることを特徴とする請求項1記載の画像解析方法。
  3. 前記解析対象画像の中心側方向の所定値Kcが、0≦Kc≦0.15(但し、この数値は解析対象画像の辺方向の長さを1に正規化した値)の範囲に設定されることを特徴とする請求項1記載の画像解析方法。
  4. 前記第1領域及び第2領域は、解析対象画像を上下半分若しくは左右半分に分割して設定されることを特徴とする請求項1記載の画像解析方法。
  5. 前記累積度数最大直線により四方形の領域を画定し、
    該四方形領域の内側であって、各々の累積度数最大直線よりも所定値Kc以内に存在する4つの直線を第1辺〜第4辺として定めた四方形領域を特定領域として検出することを特徴とする請求項1〜4のいずれかに記載の画像解析方法。
  6. 解析対象画像からエッジを抽出してエッジ画像を作成すると共に、該エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求め、
    前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を複数抽出し、
    この抽出された直線情報群の中から、解析対象画像の第1領域内において解析対象画像の最も中心側方向に近い位置に存在する直線を検出して第1辺を求め、
    前記第1領域とは異なる第2領域内において同様にして第2辺を求め、
    少なくとも前記第1辺及び第2辺で区画される領域を特定領域として検出することを特徴とする画像解析方法。
  7. 処理対象となる画像情報を取得し、
    前記画像情報に対して請求項1〜6のいずれかの画像解析方法に基づいて特定領域を検出して抽出する処理を行い、
    当該抽出された特定領域に対応する画像情報に対して、所定の画像処理を実行することを特徴とする画像処理方法。
  8. 解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成手段と、
    前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出手段と、
    前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出手段と、
    抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出手段と、
    前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定手段と、
    前記辺選定手段により検出された2以上の辺により区画される領域を特定領域として検出する領域検出手段と
    を具備することを特徴とする画像解析装置。
  9. 請求項8に記載の画像解析装置と、
    前記画像解析装置に対して被解析対象画像を入力する画像入力装置と、
    前記画像解析装置の領域検出手段により検出された特定領域に対応する画像情報に対して、所定の画像処理を行う画像処理装置と
    を具備することを特徴とする画像処理システム。
  10. コンピュータに画像解析処理を実行させるプログラムであって、
    解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成ステップと、
    前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出ステップと、
    前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出ステップと、
    前記直線検出ステップで抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出ステップと、
    前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定ステップと、
    前記辺選定ステップにより検出された2以上の辺により区画される領域を特定領域として検出する領域検出ステップと
    を含むステップを実行させるための画像解析プログラム。
  11. コンピュータに画像処理を実行させるプログラムであって、
    所定の画像入力装置から被解析対象画像を取得する画像取得ステップと、
    解析対象画像からエッジを抽出してエッジ画像を作成するエッジ画像作成ステップと、
    前記エッジ画像を構成する画素についてハフ変換投票処理を行って傾き−切片座標データを求める直線検出ステップと、
    前記傾き−切片座標データから、少なくとも傾き−切片座標における累積度数が所定値以上であって、且つ傾きが所定値以内であるとの条件を満たす直線情報を抽出する度数/傾き検出ステップと、
    前記直線検出ステップで抽出された直線情報の中から、解析対象画像の第1領域内において前記傾き−切片座標における累積度数が最大となる直線情報を求める累積度数最大直線抽出ステップと、
    前記累積度数最大直線よりも解析対象画像の中心側方向の所定値Kc以内に存在する直線を検出する辺選定ステップと、
    前記辺選定ステップにより検出された2以上の辺により区画される領域を特定領域として検出する領域検出ステップと
    検出された特定領域に対応する画像情報に対して、所定の画像処理を行う画像処理ステップと
    を含むステップを実行させるための画像処理プログラム。
JP2004291468A 2004-10-04 2004-10-04 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム Pending JP2006107034A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004291468A JP2006107034A (ja) 2004-10-04 2004-10-04 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004291468A JP2006107034A (ja) 2004-10-04 2004-10-04 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム

Publications (1)

Publication Number Publication Date
JP2006107034A true JP2006107034A (ja) 2006-04-20

Family

ID=36376714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004291468A Pending JP2006107034A (ja) 2004-10-04 2004-10-04 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム

Country Status (1)

Country Link
JP (1) JP2006107034A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008084014A (ja) * 2006-09-27 2008-04-10 Fujitsu Ltd 画像領域検出方法、該プログラム、及び該装置
CN101637015A (zh) * 2007-08-03 2010-01-27 学校法人庆应义墪 构图分析方法、具有构图分析功能的图像装置、构图分析程序、以及计算机可读记录介质
JP2012014430A (ja) * 2010-06-30 2012-01-19 Canon Inc 画像処理装置、制御方法、及びプログラム
KR20120114153A (ko) * 2011-04-06 2012-10-16 후지제롯쿠스 가부시끼가이샤 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
WO2013008746A1 (ja) 2011-07-14 2013-01-17 株式会社メガチップス 直線検出装置および直線検出方法
JP2013041315A (ja) * 2011-08-11 2013-02-28 Fujitsu Ltd 画像認識装置および画像認識方法
JP2013105276A (ja) * 2011-11-11 2013-05-30 Pfu Ltd 画像処理装置、直線検出方法及びコンピュータプログラム
JP2015035041A (ja) * 2013-08-08 2015-02-19 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US9443318B2 (en) 2011-08-30 2016-09-13 Megachips Corporation Line segment and arc detection apparatus

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008084014A (ja) * 2006-09-27 2008-04-10 Fujitsu Ltd 画像領域検出方法、該プログラム、及び該装置
CN101637015A (zh) * 2007-08-03 2010-01-27 学校法人庆应义墪 构图分析方法、具有构图分析功能的图像装置、构图分析程序、以及计算机可读记录介质
JP2012014430A (ja) * 2010-06-30 2012-01-19 Canon Inc 画像処理装置、制御方法、及びプログラム
KR101579876B1 (ko) 2011-04-06 2015-12-23 후지제롯쿠스 가부시끼가이샤 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
KR20120114153A (ko) * 2011-04-06 2012-10-16 후지제롯쿠스 가부시끼가이샤 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
WO2013008746A1 (ja) 2011-07-14 2013-01-17 株式会社メガチップス 直線検出装置および直線検出方法
US9195902B2 (en) 2011-07-14 2015-11-24 Megachips Corporation Straight line detection apparatus and straight line detection method
JP2013041315A (ja) * 2011-08-11 2013-02-28 Fujitsu Ltd 画像認識装置および画像認識方法
US9443318B2 (en) 2011-08-30 2016-09-13 Megachips Corporation Line segment and arc detection apparatus
US9721179B2 (en) 2011-08-30 2017-08-01 Megachips Corporation Line segment and arc detection apparatus
JP2013105276A (ja) * 2011-11-11 2013-05-30 Pfu Ltd 画像処理装置、直線検出方法及びコンピュータプログラム
JP2015035041A (ja) * 2013-08-08 2015-02-19 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US9361500B2 (en) 2013-08-08 2016-06-07 Casio Computer Co., Ltd. Image processing apparatus, image processing method, and recording medium

Similar Documents

Publication Publication Date Title
JP4772839B2 (ja) 画像識別方法および撮像装置
JP4952625B2 (ja) 透視変換歪み発生文書画像補正装置および方法
JP3078844B2 (ja) 文書中の前景情報を背景情報から分離する方法
US7724950B2 (en) Image processing apparatus, image processing method, computer program, and storage medium
US9569831B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium for extracting information embedded in a printed material
EP1569170A1 (en) Characteristic region extraction device, characteristic region extraction method, and characteristic region extraction program
CN110852997B (zh) 动态图像清晰度检测方法、装置、电子设备及存储介质
US9361669B2 (en) Image processing apparatus, image processing method, and program for performing a blurring process on an image
JP2009268085A (ja) 画像トリミング装置およびプログラム
US8306335B2 (en) Method of analyzing digital document images
JP2011054080A (ja) 画像処理装置および方法、並びにプログラム
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
JP2006107034A (ja) 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム
CN111881938B (zh) 一种基于盲取证技术的图像真伪鉴别的方法
JP2010056691A (ja) 画像処理装置及び画像処理方法
JP3636936B2 (ja) 濃淡画像の2値化方法および濃淡画像の2値化プログラムを記録した記録媒体
CN108647680B (zh) 图像定位框检测方法和装置
JP2000013605A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP5397468B2 (ja) パタンノイズ除去装置、パタンノイズ除去方法、パタンノイズ除去プログラム
JP2004096435A (ja) 画像解析装置、画像解析方法、および画像解析プログラム
JP2003219180A (ja) 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP2006107018A (ja) 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム
JP6101656B2 (ja) マーカ埋め込み装置、マーカ検出装置、及びプログラム
CN112862656A (zh) 一种抗打印扫描拍摄的数字图像水印方法
JP3881455B2 (ja) 画像補正装置及び画像補正方法並びに画像補正方法を記録した媒体