JP2008287353A - 検出装置および方法、プログラム、並びに記録媒体 - Google Patents

検出装置および方法、プログラム、並びに記録媒体 Download PDF

Info

Publication number
JP2008287353A
JP2008287353A JP2007129517A JP2007129517A JP2008287353A JP 2008287353 A JP2008287353 A JP 2008287353A JP 2007129517 A JP2007129517 A JP 2007129517A JP 2007129517 A JP2007129517 A JP 2007129517A JP 2008287353 A JP2008287353 A JP 2008287353A
Authority
JP
Japan
Prior art keywords
sub
telop
value
horizontal
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007129517A
Other languages
English (en)
Other versions
JP4967798B2 (ja
Inventor
Tsutomu Seki
力 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007129517A priority Critical patent/JP4967798B2/ja
Publication of JP2008287353A publication Critical patent/JP2008287353A/ja
Application granted granted Critical
Publication of JP4967798B2 publication Critical patent/JP4967798B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できるようにする。
【解決手段】領域抽出部201は、画像において、テロップを検出すべき領域を抽出し、さらにその領域を、テロップの検出に適したサブブロックに分割する。サブブロックエッジ検出部202は、サブブロックエッジ検出部202は、供給されたサブブロックの水平方向の平均値と垂直方向の平均値とを算出し、水平方向の複数の平均値のうちの最大値と最小値、および垂直方向の複数の平均値のうちの最大値と最小値に基づいてサブブロックの、水平方向および垂直方向のエッジ強度をそれぞれ検出する。テロップ領域検出部203は、水平方向および垂直方向のエッジ強度のそれぞれが検出された複数のサブブロックからなるデータに基づいて、その複数の各サブブロックがテロップを含むサブブロックであるか否かを判定する。
【選択図】図5

Description

本発明は、検出装置および方法、プログラム、並びに記録媒体に関し、特に、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できるようにする検出装置および方法、プログラム、並びに記録媒体に関する。
近年、放送される画像信号の高精細化、高解像度(HD(high definition))化が進みつつあるが、依然として標準精細(SD(Standard Definition))の画像を、HDに変換(アップコンバート)した画像信号の放送も行われている。
さらに、HDの画像として収録された素材に対してHDのテロップとSDのテロップが混在する例も見受けられる。
また、近年、HDD(Hard Disk Drive)レコーダなどの普及に伴って、画像信号を解析して、特定の場面などを簡単に検索できるようにするニーズが高まっており、特に、テロップが含まれる画像を検出するニーズが高まっている。
解像度の向上したSD信号からHD信号へのアップコンバートできるようにする技術も提案されている(例えば、特許文献1参照)。
特許第3326879号公報
従来、テロップの検出は、画像の中のエッジを検出し、検出されたエッジ数などに基づいてテロップが存在するか否かを判定することにより行われていた。
しかしながら、SDのテロップと、HDのテロップとが混在する画像においては、輪郭部が強調されたシャープネスの高い画像であるHDの素材の中から、輪郭が比較的曖昧なSDのテロップを検出することになり、従来の方式では、適切にテロップを検出することができない。
本発明はこのような状況に鑑みてなされたものであり、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できるようにするものである。
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部とを備える検出装置である。
注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第1の指標を抽出して、前記第1の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる水平フィルタにより処理して得られる水平処理データと、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタにより処理して得られる垂直処理データとに基づいて、前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段をさらに備えるようにすることができる。
前記テロップ情報出力手段は、前記水平処理データと、前記垂直処理データとに基づいて、斜処理データをさらに生成し、前記水平処理データの値が第1の閾値を超え、前記垂直処理データの値が第2の閾値を超え、かつ前記斜処理データの値が第3の閾値を超えた場合、前記注目するサブブロックに、テロップが含まれていると判定するようにすることができる。
前記水平フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、水平方向のストライプ模様の画像が含まれる場合、高い値の前記水平処理データが得られるように、前記数値が設定され、前記水平フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、垂直方向のストライプ模様の画像が含まれる場合、高い値の前記垂直処理データが得られるように、前記数値が設定されるようにすることができる。
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置の検出方法であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出し、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出するステップを含む検出方法である。
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出処理をコンピュータに行わせるプログラムであって、コンピュータを、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部として機能させるプログラムである。
本発明の一側面においては、画像データが、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割され、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値が算出され、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値が算出され、前記M個の水平方向の平均値の中の最大値と最小値の差が、前記テロップが含まれる領域を特定するための第1の指標として算出され、前記N個の垂直方向の平均値の中の最大値と最小値の差が、前記テロップが含まれる領域を特定するための第2の指標として算出される。
本発明によれば、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面の検出装置は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段(例えば、図5の領域抽出部201)と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段(例えば、図6の演算器221)と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段(例えば、図6の演算器222)と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標(例えば、水平方向エッジ強度)として算出する水平指標算出部(例えば、図6演算器241)と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標(例えば、垂直方向エッジ強度)として算出する垂直指標算出部(例えば、図6演算器242)とを備える。
この検出装置は、注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第1の指標を抽出して、前記第1の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータ(例えば、図7のデータh0)を、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる水平フィルタ(例えば、図7の水平フィルタ262)により処理して得られる水平処理データ(例えば、図7のデータh1)と、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータ(例えば、図7のデータv0)を、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタ(例えば、図7の垂直フィルタ261)により処理して得られる垂直処理データ(例えば、図7のデータv1)とに基づいて、前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段(例えば、図5のテロップ領域検出部203)をさらに備えるようにすることができる。
本発明の一側面の検出方法は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置の検出方法であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し(例えば、図10のステップS101の処理)、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し(例えば、図11のステップS121の処理)、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し(例えば、図11のステップS123の処理)、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標(例えば、水平方向エッジ強度)として算出し、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標(例えば、垂直方向エッジ強度)として算出する(例えば、図11のステップS125とS126の処理)ステップを含む。
以下、図面を参照して、本発明の実施の形態について説明する。
最初に従来のテロップの検出の処理について説明する。
画像の中に含まれるテロップを検出する場合、従来より、画像の中の所定の領域のエッジを検出し、検出されたエッジの強度などを表す情報に基づいてその領域にテロップが含まれているか否かを判定する方式が用いられている。通常、文字であるテロップは、ストロークの組み合わせにより構成されており、例えば、ストライプ模様の画像のように、エッジが繰り返し出現することが多いからである。
図1は、従来、テロップを検出するために行われていたエッジ検出の例を説明する図である。同図においては、Sobelフィルタが用いられている。
図1において、テロップを検出すべき画像は、水平方向および垂直方向に複数の画素で構成されるサブブロックと呼ばれる領域に分割されてSobelフィルタに入力される。この例では、矩形の領域に配置された所定の数の画素で構成されたサブブロックがSobelフィルタに入力されている。
Sobelフィルタは、水平フィルタ21と垂直フィルタ22を有する構成とされ、入力されたサブブロックの中の注目画素と、注目画素に隣接する複数の画素の画素値に、それぞれ各フィルタに記載された数値が、乗算器31と乗算器32によってそれぞれ乗じられるようになされている。この例では、水平フィルタ21と垂直フィルタ22は、それぞれ中央の画素が注目画素とされ、注目画素に隣接する8つの画素に対応する構成とされている。このような、水平フィルタ21と垂直フィルタ22、および乗算器31と乗算器32による処理が、サブブロックの画素のそれぞれに対して行われる。
そして、水平フィルタ21と垂直フィルタ22、および乗算器31と乗算器32による処理を経たサブロックの画素のそれぞれに対して閾値判定部41および閾値判定部42による閾値判定の処理が行われる。これにより、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素が検出されることになる。
さらに、集計器51および集計器52によって、水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素のそれぞれの合計値が検出され、その合計値が水平方向のエッジ強度および垂直方向のエッジ強度として出力される。
このようにして得られた、水平方向のエッジ強度および垂直方向のエッジ強度に基づいて、そのサブブロックにテロップが含まれているか否かの判定が行われる。
しかしながら、図1を参照して上述した方式では、テロップが含まれているか否かを正確に検出できないことがある。
図2は、テロップが含まれた画像の例を示す図である。同図に示される画像100においては、領域101と領域102にそれぞれテロップが表示されているが、領域101に表示されるテロップは、高解像度(HD(high definition))の画像として表示されるテロップであり、領域102に表示されるテロップは、HD画像より低い標準解像度(SD(Standard Definition))の画像として表示されるテロップである。
すなわち、画像100は、HDの画像とSDの画像が混在する画像とされ、このような画像は、例えば、HDの画像として収録された素材に対してテロップの編集が行われた画像、またはSDの画像をHDに変換(アップコンバート)した画像などにおいて近年多く見受けられる。
SDのテロップと、HDのテロップとが混在する画像においては、輪郭部が強調されたシャープネスの高い画像であるHD画像の素材の中から、輪郭が比較的曖昧なSD画像のテロップを検出することになり、従来の方式では、適切にテロップを検出することができない。
すなわち、シャープネスの高い画像であるHD画像において、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素を検出する場合、図1の閾値判定部41および閾値判定部42にある程度高い閾値を設定しなければ、エッジとは関係ない画素までエッジを構成する画素として検出されてしまう。また、シャープネスの低い画像であるSD画像において、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素を検出する場合、図1の閾値判定部41および閾値判定部42にある程度低い閾値を設定しなければ、エッジ構成する画素であるにも係らず検出されない画素が増えてしまう。
図3と図4は、図1を参照して上述した従来の方式により、HDの画像とSDの画像が混在する画像のエッジ検出を行う場合の問題点を説明する図である。
図3は、従来の方式により、例えば、領域101の一部のHD画像のサブブロック141と、領域102の一部のSD画像のサブブロック142について、垂直方向のエッジ強度を検出する例を示しており、閾値判定部42にHD画像に適した閾値を設定した場合の例を示す図である。
サブブロック141には、例えば、文字の一部が図中左から数えて第10列目乃至第18列目の各画素で表示されており、第1列目乃至第9列目の各画素はその文字の背景を表示している。サブブロック141は、HD画像であり、文字の一部は、黒色で明確に表示され、背景は白色で明確に表示されている。
一方、サブブロック142は、SD画像であり、文字の一部と、背景との境界(エッジ)が曖昧に表示される。この例では、図中左から第7列目乃至第12列目の各画素が黒色でもなく、白色でもない色(図中のハッチング)として表示されている。
サブブロック141およびサブブロック142に対して、上述した垂直フィルタ22、および乗算器32による処理を施し、HD画像に適した閾値を設定した閾値判定部42による閾値判定の処理が行われた場合、図3の垂直フィルタ22の右側において、図中黒い四角形で表示された画素が、垂直方向にエッジを構成すると考えられる画素として検出されることになる。
図3の場合、閾値判定部42にHD画像に適した閾値が設定されているので、サブブロック141においては、文字の一部と背景との境界に当たる画素であって、第9列目と第10列目の画素が全てエッジを構成する画素として検出されている。これにより、サブブロック141の垂直方向のエッジ強度は、第9列目と第10列目の画素数の合計値である「8」となる。
しかしながら、SD画像のサブブロック142においては、第7列目乃至第12列目の各画素が白色から黒色に序々に変化していくため、HD画像に適した閾値が設定された閾値判定部42の閾値判定では、エッジを構成する画素として検出される画素がない。これにより、サブブロック142の垂直方向のエッジ強度は、「0」となってしまう。
図4は、従来の方式により、例えば、領域101の一部のHD画像のサブブロック141と、領域102の一部のSD画像のサブブロック142について、垂直方向のエッジ強度を検出する例を示しており、閾値判定部42にSD画像に適した閾値を設定した場合の例を示す図である。
図3の場合と同様に、サブブロック141およびサブブロック142に対して、上述した垂直フィルタ22、および乗算器32による処理を施し、SD画像に適した閾値を設定した閾値判定部42による閾値判定の処理が行われた場合、図4の垂直フィルタ22の右側において、図中黒い四角形で表示された画素が、垂直方向にエッジを構成すると考えられる画素として検出されることになる。
図4の場合、閾値判定部42にSD画像に適した閾値が設定されているので、サブブロック142においては、文字の一部と背景との境界に当たる画素であって、第7列目乃至第12列目の画素が全てエッジを構成する画素として検出されている。これにより、サブブロック142の垂直方向のエッジ強度は、第7列目乃至第12列目の画素数の合計値である「24」となる。
しかしながら、HD画像のサブブロック141においては、第9列目と第10列目の間のみ画素の色が変化しているため、閾値判定部42の閾値判定では、エッジを構成する画素として検出される画素は、第9列目と第10列目の画素のみがエッジを構成する画素として検出される。これにより、サブブロック141の垂直方向のエッジ強度は、「8」となってしまう。
このように、従来の方式では、閾値判定部42の閾値をHD画像に適したものとすると、SD画像では全くエッジが検出されなくなり、閾値をSD画像に適したものとすると、HD画像の場合よりSD画像の場合の方が、より大きなエッジ強度となってしまう。
なお、図3と図4では、説明を簡単にするために垂直方向のエッジ強度についてのみ説明したが、水平方向のエッジ強度も同様に、やはり従来の方式では正確に検出することが困難である。
さらに、HDの画像においては、画像のシャープネスが高いため、例えば、石や砂などのように、色の濃い画素が粒状に表示されている画像において、これらの画素がエッジを構成する画素として誤って検出されてしまうことがある。
例えば、図2の領域103は、石造りの壁の一部が表示された画像であり、細かい粒状の模様が表示されている。このような画像も誤ってエッジとして検出されることがある。
そこで、本発明においては、SD画像とHD画像が混在する画像においても適切にテロップを検出できるようにし、さらに、細かい粒状の模様などが表示された画像が誤ってエッジとして検出されないようにする。
図5は、本発明の一実施の形態に係るテロップ検出装置の構成例を示すブロック図である。この例では、テロップ検出装置200が、領域抽出部201、サブブロックエッジ検出部202、テロップ領域検出部203、および制御部204により構成されており、例えば、バスなどにより、領域抽出部201乃至制御部204が相互に接続された構成とされている。
同図において、領域抽出部201は、例えば、制御部204を介して入力が受け付けられた画像データの画像において、テロップを検出すべき領域を抽出し、さらにその領域を、テロップの検出に適したサブブロックに分割する。
サブブロックエッジ検出部202は、例えば、制御部204を介して、領域抽出部201により分割されたサブブロックの画像データの供給を受けて、サブブロックの、水平方向および垂直方向のエッジ強度をそれぞれ検出する。
テロップ領域検出部203は、サブブロックエッジ検出部202により水平方向および垂直方向のエッジ強度のそれぞれが検出された複数のサブブロックからなるデータを、例えば、制御部204を介して取得し、その複数の各サブブロックがテロップを含むサブブロックであるか否かを判定し、テロップを含むサブブロックであると判定されたサブブロックからなる領域に関する情報を出力するようになされている。
制御部204は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを含む構成とされ、例えば、図示せぬ操作部などを介して入力が受け付けられたユーザの指令、予めROMなどに記憶されているプログラムなどのソフトウェアなどに基づいて、テロップ検出装置200の各部を制御するようになされている。
図6は、図5のサブブロックエッジ検出部202の詳細な構成例を示す図である。ここでは、サブブロックとして、水平方向に8画素、垂直方向に4画素の32画素で構成される画像データがサブブロック220として供給された場合を例として、サブブロックエッジ検出部202の詳細な構成について説明する。
同図に示されるように、サブブロックエッジ検出部202は、供給されたサブブロック220の水平方向の図中上から第1行目乃至第4行目の、それぞれ8個の画素の画素値の平均値を演算器221により、それぞれ演算する。すなわち、演算器221により、サブブロック220の第1行目の8つの画素の画素値の平均値、第2行目の8つの画素の画素値の平均値、第3行目の8つの画素の画素値の平均値、および第4行目の8つの画素の画素値の平均値がそれぞれ演算される。ここで演算された値を、水平方向の4つの平均値と称することとする。
また、サブブロックエッジ検出部202は、供給されたサブブロック220の垂直方向の図中左から第1列目乃至第8列目の、それぞれ4個の画素の画素値の平均値を演算器222により、それぞれ演算する。すなわち、演算器222により、サブブロック220の第1列目の4つの画素の画素値の平均値、第2列目の4つの画素の画素値の平均値、第3列目の4つの画素の画素値の平均値、・・・および第8列目の4つの画素の画素値の平均値がそれぞれ演算される。ここで演算された値を、垂直方向の8つの平均値と称することとする。
サブブロックエッジ検出部202は、水平方向の4つの平均値のうちの最小値を、最小値抽出部231により抽出し、水平方向の4つの平均値のうちの最大値を、最大値抽出部232により抽出する。また、サブブロックエッジ検出部202は、垂直方向の8つの平均値のうちの最小値を、最小値抽出部233により抽出し、垂直方向の8つの平均値のうちの最大値を、最大値抽出部234により抽出する。
そして、サブブロックエッジ検出部202は、最小値抽出部231により抽出された最小値と、最大値抽出部232により抽出された最大値の差を演算器241により演算し、その結果得られた値を水平方向のエッジ強度として出力する。同様に、サブブロックエッジ検出部202は、最小値抽出部233により抽出された最小値と、最大値抽出部234により抽出された最大値の差を演算器242により演算し、その結果得られた値を垂直方向のエッジ強度として出力する。
このように、サブブロックを構成する各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、例えば、図3と図4のサブブロック142の場合のように、白色から黒色に序々に変化していく曖昧な画像であっても、適切なエッジ強度を算出することができるし、勿論、サブブロック141の場合のように、白色から黒色に急峻に変化する(シャープネスの高い)画像であっても、適切なエッジ強度を算出することができる。従って、サブブロックエッジ検出部202によれば、SD画像であっても、HD画像であってもエッジ部分のサブブロックでは、ほぼ同じエッジ強度を検出することが可能となる。
さらに、サブブロックを構成する各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、例えば、図2の領域103に示されるような、細かい粒状の模様が表示された画像などが誤ってエッジとして検出されることが抑止されるようにすることも可能となる。例えば、白色の背景に黒色の点が規則的に散りばめられた画像のサブブロックにおいて、各画素の水平方向(または垂直方向)の1行分の全画素(または1列分の全画素)の画素値の平均値を算出すると、どの行(または列)においても、灰色の画素の画素値と同様の値となり、それらの複数の平均値の最大値と最小値の差はほぼ「0」となるからである。
また、このようにすることで、演算量を抑制することも可能となる。例えば、図1を参照して上述したsobelフィルタにおいては、水平フィルタ21と垂直フィルタ22を通すことで、水平フィルタ21と垂直フィルタ22の中の値が0でない位置における演算が行われて、1個の画素について合計12(=6+6)回の乗算処理が必要となるが、各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、個々の画素に対して行われる演算量を少なくすることも可能となる。
ここでは、サブブロックとして、水平方向に8画素、垂直方向に4画素の32画素で構成される画像データが供給される例について説明したが、テロップを検出するために、エッジの検出を行う場合、サブブロックの水平方向および垂直方向の画素数は、それぞれ検出すべきテロップの文字のストロークの太さに対応する画素数とすることが望ましい。
また、サブブロックの一部がそれぞれ重複(オーバーラップ)するようになされてもよい。例えば、第n番目のサブブロックを構成する複数の画素の一部が、第n+1番目のサブブロックの画素として用いられるようにサブブロックの分割が行われるようにしてもよい。
図7は、図5のテロップ領域検出部203の詳細な構成例を示す図である。
上述したように、テロップ領域検出部203は、サブブロックエッジ検出部202により水平方向および垂直方向のエッジ強度のそれぞれが検出された複数のサブブロックからなるデータを、例えば、制御部204を介して取得する。この例では、水平方向に3個、垂直方向に3個の9個のサブブロックで構成されたデータv0とデータh0が取得されている。
データv0は、例えば、それぞれのサブブロックの位置に、それぞれのサブブロックの垂直方向のエッジ強度の値のみが埋め込まれた3行3列の行列のデータとして取得され、データh0は、例えば、それぞれのサブブロックの位置に、それぞれのサブブロックの水平方向のエッジ強度の値のみが埋め込まれた、3行3列の行列のデータとして取得される。
テロップ領域検出部203は、垂直フィルタ261と水平フィルタ262を有する構成とされ、入力されたデータv0とデータh0の各値に、それぞれ垂直フィルタ261と水平フィルタ262に記載された数値が、乗算器271と乗算器272によってそれぞれ乗じられるようになされている。
例えば、データv0の図中左から第1列目の3つの値には、それぞれ垂直フィルタ261の図中左から第1列目の値である「1、1、1」がそれぞれ乗じられ、データv0の第2列目の3つの値には、それぞれ垂直フィルタ261の第2列目の値である「2、2、2」がそれぞれ乗じられ、データv0の第3列目の3つの値には、それぞれ垂直フィルタ261の第3列目の値である「1、1、1」がそれぞれ乗じられる。さらに、それぞれの数値が乗じられた9つの値の合計値が、垂直方向エッジ指数として乗算器271により算出される。
なお、この垂直方向エッジ指数は、データv0の中央の位置であって、第2行第2列目のサブブロックに対応する垂直方向エッジ指数として算出される。
また、データh0の図中上から第1行目の3つの値には、それぞれ水平フィルタ262の図中上から第1行目の値である「1、1、1」がそれぞれ乗じられ、データh0の第2列目の3つの値には、それぞれ水平フィルタ262の第2行目の値である「2、2、2」がそれぞれ乗じられ、データh0の第3行目の3つの値には、それぞれ水平フィルタ262の第3行目の値である「1、1、1」がそれぞれ乗じられる。さらに、それぞれの数値が乗じられた9つの値の合計値が、水平方向エッジ指数として乗算器272により算出される。
なお、この水平方向エッジ指数は、やはりデータh0の中央の位置であって、第2行第2列目のサブブロックに対応する水平方向エッジ指数として算出される。
テロップ領域検出部203において、垂直方向エッジ指数は、データv1として閾値判定部281に供給される。閾値判定部281は、データv1の値が予め設定された縦閾値より大きいか否かを判定し、例えば、データv1の値が予め設定された縦閾値より大きいと判定された場合、値「1」を出力し、データv1の値が縦閾値より大きくないと判定された場合、値「0」を出力するようになされている。
また、テロップ領域検出部203において、垂直方向エッジ指数は、データh1として閾値判定部283に供給される。閾値判定部283は、データh1の値が予め設定された横閾値より大きいか否かを判定し、例えば、データh1の値が予め設定された横閾値より大きいと判定された場合、値「1」を出力し、データh1の値が予め設定された横閾値より大きくないと判定された場合、値「0」を出力するようになされている。
さらに、テロップ領域検出部203において、データv1とデータh1は、加算器273により加算され、データd1として閾値判定部282に供給される。データd1は、いわば斜方向エッジ指数を表すことになる。閾値判定部282は、データd1の値が予め設定された斜閾値より大きいか否かを判定し、例えば、データd1の値が予め設定された斜閾値より大きいと判定された場合、値「1」を出力し、データd1の値が予め設定された斜閾値より大きくないと判定された場合、値「0」を出力するようになされている。
そして、論理積演算器291が、閾値判定部281乃至閾値判定部283の出力値の論理積を演算して出力する。例えば、論理積演算器291の演算結果が値「1」の場合、注目するサブブロック(データv0(h0)の第2行第2列目のサブブロック)は、テロップのサブブロックであるものとして、テロップ領域検出部203の検出結果が出力される。論理積演算器291の演算結果が値「0」の場合、注目するサブブロック(データv0(h0)の第2行第2列目のサブブロック)は、テロップのサブブロックではないものと判定される。
なお、垂直フィルタ261と水平フィルタ262は、それぞれ垂直方向のストライプ模様と、水平方向のストライプ模様を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値となるように設定されており、例えば、垂直方向の一本線と、水平方向の一本線を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値とならないように設定されている。テロップは、ストライプ模様の画像を構成することが多いからである。
例えば、図8(a)に示されるように「川」という文字が表示されたテロップについて考える。同図に示される「川」の文字は、黒線の囲み文字(白抜き文字)として表示されており、図中中央付近を矢印311で示されるように、画素の輝度の変化を調べると、図8(b)に示されるグラフのようになる。
すなわち、文字の白抜き部分では輝度が極めて高くなり、文字の黒線の部分では輝度が極めて低くなる。また、文字の背景の部分では、白抜き部分と黒線の部分の中間程度の輝度となる。このように、文字「川」の周辺においては、画素の輝度値が12回変化し、あたかもストライプ模様の画像と同様の輝度の変化の特性が見られることになる。
これに対して、テロップではない物体などの画像では、上述したような特性は見られない。図9(a)は、図中右側略半分に暗い色の物体が表示された画像の例を示している。このような画像において、図8(a)の場合と同様に、図中中央付近を矢印312で示されるように、画素の輝度の変化を調べると、図9(b)に示されるグラフのようになる。
すなわち、物体の背景が表示された部分では輝度が高くなり、物体が表示された部分では輝度が低くなる。このように、テロップではなく、単に輝度の異なる物体などが表示された画像の周辺においては、画素の輝度値が1回変化し、あたかも一本線の画像と同様の輝度の変化の特性が見られることになる。
垂直フィルタ261は、自分(注目するサブブロック)とその周辺のサブブロックにおいて、例えば、図8(b)に示されるような輝度の変化の特性を有するサブブロックの垂直方向エッジ指数が高い値となるように設定されており、例えば、自分とその周辺のサブブロックにおいて、例えば、図9(b)に示されるような輝度の特性を有するサブブロックの垂直方向エッジ指数が高い値とならないように設定されている。
そして、閾値判定部281も、サブブロックの垂直方向エッジ指数が高い値の場合のみ、値「1」を出力するようになされている。
ここでは、例として垂直方向のストライプ模様について説明したが、画像の中で文字が表示された領域においては、水平方向にも、やはりあたかもストライプ模様の画像と同様の特性が見られる。従って、水平フィルタ262も、あたかもストライプ模様の画像と同様の輝度の変化の特性を有するサブブロックの水平方向エッジ指数が高い値となるように設定されており、あたかも一本線の画像と同様の輝度の変化の特性を有するサブブロックの水平方向エッジ指数が高い値とならないように設定されており、閾値判定部283も、サブブロックの水平方向エッジ指数が高い値の場合のみ、値「1」を出力するようになされている。
さらに、閾値判定部282も同様に、サブブロックの垂直方向のエッジ指数(データv1)と水平方向エッジ指数(データh1)の加算値(データd1)が高い値の場合のみ、値「1」を出力するようになされている。
なお、垂直フィルタ261と水平フィルタ262の設定は、それぞれ垂直方向のストライプ模様、または水平方向のストライプ模様を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値となり、垂直方向の一本線、または水平方向の一本線を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値とならないようにするものであれば、図7に示されたものとは異なる設定とされるようにしてもよい。
次に、図10のフローチャートを参照して、テロップ検出装置200によるテロップ検出処理について説明する。
ステップS101において、領域抽出部201は、画像をサブブロックに分割する。このとき、領域抽出部201は、例えば、制御部204を介して入力が受け付けられた画像データの画像において、テロップを検出すべき領域を抽出し、さらにその領域を、テロップの検出に適したサブブロックに分割する。
ステップS102において、サブブロックエッジ検出部202は、ステップS201の処理で分割された各サブブロックについて、図11を参照して後述するサブブロックエッジ検出処理を実行する。これにより、各サブブロックの水平方向エッジ強度と、垂直方向エッジ強度とが算出される。
ここで、図11のフローチャートを参照して、図10のステップS102のサブブロックエッジ検出処理の詳細の例について説明する。
ステップS121において、サブブロックエッジ検出部202は、供給されたサブブロックの水平方向の各行の画素値の平均値を演算器221により、それぞれ演算する。
ステップS122において、サブブロックエッジ検出部202は、ステップS121の処理で演算された水平方向の各行の画素値の平均値のそれぞれについて最大値と最小値を求める。
このとき、例えば、図6を参照して上述したように、供給されたサブブロック220の水平方向の第1行目乃至第4行目の、それぞれ8個の画素の画素値の平均値を演算器221により、それぞれ演算され、水平方向の4つの平均値のうちの最小値が、最小値抽出部231により抽出され、水平方向の4つの平均値のうちの最大値が、最大値抽出部232により抽出される。
ステップS123において、サブブロックエッジ検出部202は、供給されたサブブロックの垂直方向の各列の画素値の平均値を演算器222により、それぞれ演算する。
ステップS124において、サブブロックエッジ検出部202は、ステップS123の処理で演算された垂直方向の各列の画素値の平均値のそれぞれについて最大値と最小値を求める。
このとき、例えば、図6を参照して上述したように、供給されたサブブロック220の垂直方向の第1列目乃至第8列目の、それぞれ4個の画素の画素値の平均値が演算器222により、それぞれ演算され、垂直方向の8つの平均値のうちの最小値が、最小値抽出部233により抽出され、垂直方向の8つの平均値のうちの最大値が、最大値抽出部234により抽出される。
ステップS125において、サブブロックエッジ検出部202は、ステップS122の処理と、ステップS124の処理で求められたそれぞれの最大値と最小値の差を、それぞれ求める。
このとき、例えば、図6を参照して上述したように、最小値抽出部231により抽出された最小値と、最大値抽出部232により抽出された最大値の差が演算器241により演算され、最小値抽出部233により抽出された最小値と、最大値抽出部234により抽出された最大値の差が演算器242により演算される。
ステップS126において、サブブロックエッジ検出部202は、ステップS125の処理により得られた値を、当該サブブロックの水平方向のエッジ強度、または垂直方向のエッジ強度として出力する。
このとき、例えば、図6を参照して上述したように、演算器241の演算結果の値が水平方向のエッジ強度とされ、演算器242の演算結果の値が垂直方向のエッジ強度とされて、サブブロック220の位置を表す情報などと対応付けられて出力される。
なお、上述したステップS121乃至S126は、サブブロックエッジ検出部202に供給される複数のサブブロックのそれぞれに対して実行され、複数のサブブロックのそれぞれの、水平方向のエッジ強度、または垂直方向のエッジ強度が出力されることになる。
このようにして、サブブロックのエッジ強度が検出(算出)される。
図10に戻って、ステップS102の処理の後、ステップS103において、テロップ領域検出部203は、ステップS102の処理結果に基づいて、図12を参照して後述するテロップ領域検出処理を実行する。これにより、テロップのサブブロックに関する情報が出力される。
ここで、図12のフローチャートを参照して、図10のステップS103のテロップ領域検出処理の詳細の例について説明する。
ステップS151において、テロップ領域検出部203は、複数のサブブロックの水平方向のエッジ強度を抽出し、ステップS152において、複数のサブブロックの垂直方向のエッジ強度を抽出する。
これにより、例えば、図7を参照して上述したように、それぞれのサブブロックの位置に、それぞれのサブブロックの垂直方向のエッジ強度の値のみが埋め込まれた行列のデータとしてデータv0が取得され、それぞれのサブブロックの位置に、それぞれのサブブロックの水平方向のエッジ強度の値のみが埋め込まれた行列のデータとしてデータh0が取得される。
ステップS153において、テロップ領域検出部203は、フィルタ処理をする。
このとき、例えば、図7を参照して上述したように、入力されたデータv0とデータh0の各値に、それぞれ垂直フィルタ261と水平フィルタ262に記載された数値が、乗算器271と乗算器272によってそれぞれ乗じられ、さらに、それぞれの数値が乗じられた9つの値の合計値が、垂直方向エッジ指数と水平方向エッジ指数として乗算器271と乗算器272により算出される。
なお、この水平方向エッジ指数と垂直方向エッジ指数は、データv0またはデータh0の中央の位置のサブブロックに対応する垂直方向エッジ指数(データv1)と水平方向エッジ指数(データh1)として算出される。
ステップS154において、テロップ領域検出部203は、縦、横、斜方向のストライプを検出する。
このとき、例えば、図7を参照して上述したように、閾値判定部281により、データv1の値が予め設定された縦閾値より大きいか否かが判定され、例えば、データv1の値が予め設定された縦閾値より大きいと判定された場合、値「1」が出力され、データv1の値が縦閾値より大きくないと判定された場合、値「0」が出力される。同様に、閾値判定部283により、データh1の値が予め設定された横閾値と比較され、値「1」または値「0」が出力される。さらに、閾値判定部282により、データd1の値が予め設定された斜閾値と比較され、値「1」または値「0」が出力される。
ステップS155において、テロップ領域検出部203は、縦、横、斜の各方向にそれぞれストライプが検出されたか否かを判定する。例えば、図7の論理積演算器291が、閾値判定部281乃至閾値判定部283の出力値の論理積を演算し、その演算結果が値「1」である場合、縦、横、斜の各方向にそれぞれストライプが検出されたと判定し、処理はステップS156に進む。
ステップS156において、テロップ領域検出部203は、当該サブブロックを、テロップのサブブロックであるものとして検出する。
一方、ステップS155において、図7の論理積演算器291の演算結果が値「0」である場合、縦、横、斜の各方向にそれぞれストライプが検出されなかったと判定され、ステップS156の処理はスキップされて処理が終了する。
このようにして、テロップのサブブロックが検出される。
図13と図14を参照して、本発明のテロップ検出装置200によるテロップの検出結果について説明する。
図13は、画像の中に表示されているテロップの画像の特徴量の分布を説明するグラフである。同図は、図中横軸方向(x軸方向)が、図7を参照して上述したデータv1の値を表しており、図中縦軸方向(y軸方向)が図7を参照して上述したデータh1の値を表しており、それぞれのデータv1とデータh1の値のサブブロックにおいて、テロップが存在する確率の高さを、紙面と垂直となる軸方向(z軸方向)に表しており、同図に示される「20000」、「40000」などの数値は、テロップが存在する確率の高さを等高線として表すためのものである。
同図において、紙面の高さは、テロップが存在する確率の高さが約50%の位置に対応し、紙面から上に向かうほど、テロップが存在する確率は高くなり、紙面より下に向かうほど、テロップが存在する確率は低くなるものとする。従って、同図の紙面の高さでは、等高線の数値は「0」となる。
同図において、図中左下側は、等高線の数値が「−20000」、「−40000」などと表示されているように、テロップが存在する確率は極めて低い。すなわち、データv1と、データh1とがともに低い値となるサブブロックにおいて、テロップが存在している確率は極めて低い。この領域では、データv1、データh1ともに低い値であり、この領域のサブブロックの画像においては、例えば、ストライプ模様のようなエッジは検出されなかったことになる。
また、同図の図中右下側も等高線の数値が「0」程度となり、やはりテロップが存在する確率は極めて低い。図中の領域351では、等高線の記載はないが、実際には「−20000」乃至「0」程度となる。領域351では、データh1の値は低いものの、データv1の値はかなり高いので、かなりのエッジ強度が検出されたはずである。しかしながら、領域351は、例えば、ブラインドの画像などが表示されたサブブロックである確率が高く、結果としてテロップが存在する確率は極めて低いものとなる。
このように、テロップが存在する確率が極めて低い領域が除去されるように、図7の縦閾値、横閾値、斜閾値を設定する必要がある。本発明においては、例えば、図13の線371、線372、および線373で示されるように、それぞれ縦閾値、横閾値、斜閾値が設定される。このようにすることで、テロップが存在する確率が極めて低いサブブロックが、テロップが含まれるサブブロックとして検出されてしまうことが抑止される。特に、線371と線372に加えて、線373(斜閾値)を設定したことにより、図中左下側のテロップが存在する確率は極めて低い領域が、テロップが含まれるサブブロックとしての検出対象サブブロックから、適切に除去されるようになされている。
図14は、従来の方式により、テロップが含まれるサブブロックを検出した場合と、本発明のテロップ検出装置200によりテロップが含まれるサブブロックを検出した場合とを比較したグラフである。
同図においては、図中横軸が再現率とされ、図中縦軸が適合率とされており、従来の方式により、テロップが含まれるサブブロックを検出した場合と、本発明のテロップ検出装置200によりテロップが含まれるサブブロックを検出した場合の再現率と適合率の変化が、それぞれ線401と線402で示されている。
ここで、再現率と適合率について説明する。
例えば、テロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロックであって、実際にテロップが含まれていたサブブロックの集合をtp(true-positive)とし、テロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロックであって、実際にはテロップが含まれていなかったサブブロックの集合をfp(false-positive)とする。
また、実際にはテロップが含まれていたにも係らずテロップ検出装置200によりテロップが含まれるサブブロックとして検出されなかったサブブロックの集合をfn(false-negative)とし、実際にテロップが含まれておらずテロップ検出装置200によりテロップが含まれるサブブロックとして検出されなかったサブブロックの集合をtn(true-negative)とする。
例えば、1枚の画像を構成するサブブロック全体の集合の中でのtp、fp、fn、およびtnの関係は、図15に示されるようになる。すなわち、fnとtpの和が実際にテロップが含まれていたサブブロック(正解)であり、tpとfpの和がテロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロック(検出結果)である。
再現率は、正解のうち、実際に検出された割合を表すものであって、次式により求められる。
再現率=tp/(tp+fn)
適合率は、検出結果の中での正解の割合を表すものであって、次式により求められる。
適合率=tp/(tp+fp)
テロップ検出装置の検出性能の観点からのみいえば、再現率および適合率ともに100%を実現することが望ましいが、実際には、このような検出結果を得ることは難しい。
例えば、図2に示した画像において、図16に示されるような楕円で囲まれた領域のサブブロックがテロップ検出装置200によりテロップが含まれるサブブロックとして検出された場合、再現率100%となる。ただし、図16の楕円で囲まれた領域には、テロップではない画像も含まれている。
すなわち、極論すればテロップが含まれるか否かにかかわらず、全てのサブブロックを検出した場合、tn = fn = 0 となるため再現率は100%となるが、適合率は低くなる。
また、例えば、図2に示した画像において、図17に示されるような楕円で囲まれた領域のサブブロックがテロップ検出装置200によりテロップが含まれるサブブロックとして検出された場合、適合率100%となる。ただし、図17の楕円で囲まれた領域には、テロップの画像のごく一部が含まれているにすぎず、他にも検出されるべき領域が残っている。
すなわち、極論すれば、画面全体の中から1個のサブブロックのみを検出し、それが正解であれば適合率は100% となるが、再現率は低くなる。
ここでは、テロップの文字列の中に存在する空白の領域なども正解(テロップが含まれている)として考え、文字の間隔等から文字列の中に存在する文字と空白の領域の比率を50%と想定し、再現率50%の検出結果が得られたときの適合率について従来の方式と本発明との違いを説明する。
図14に戻って、例えば、再現率50%の検出結果が得られた場合、線401で示される従来の方式では、適合率が68%(0.68)であったのに対して、線402で示される本発明によれば、適合率は92%(0.92)となっている。また、再現率50%の検出結果が得られた場合、線401で示される従来の方式では、誤認識率が32%(=1−0.68)であったのに対して、線402で示される本発明によれば、誤認識率は8%(=1−0.92)となっている。
すなわち、本発明により、従来の方式と比較して適合率は24%程度向上し、誤認識率は、1/4程度に低下したと言える。
また、線402は、再現率が0に近づくに従って適合率が1.0(100%)に近づいていくが、線401は、再現率が0に近づくに従って適合率が0.2(100%)程度に近づいている。
すなわち、従来の方式では、例えば、閾値を厳格に設定するなどして、再現率を犠牲にしてでも高い適合率を得ることが難しかったのに対して、本発明では、ある程度再現率を犠牲にすれば、それだけ高い適合率を得ることが可能である。
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図18に示されるような汎用のパーソナルコンピュータ500などに、ネットワークや記録媒体からインストールされる。
図18において、CPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記憶されているプログラム、または記憶部508からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU501、ROM502、およびRAM503は、バス504を介して相互に接続されている。このバス504にはまた、入出力インタフェース505も接続されている。
入出力インタフェース505には、キーボード、マウスなどよりなる入力部506、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部507、ハードディスクなどより構成される記憶部508、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部509が接続されている。通信部509は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース505にはまた、必要に応じてドライブ510が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア511が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部508にインストールされる。
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア511などからなる記録媒体からインストールされる。
なお、この記録媒体は、図18に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア511により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM502や、記憶部508に含まれるハードディスクなどで構成されるものも含む。
本明細書において上述した一連の処理を実行するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
従来、テロップを検出するために行われていたエッジ検出の例を説明する図である。 テロップが含まれた画像の例を示す図である。 従来の方式により、HDの画像とSDの画像が混在する画像のエッジ検出を行う場合の問題点を説明する図である。 従来の方式により、HDの画像とSDの画像が混在する画像のエッジ検出を行う場合の問題点を説明する図である。 本発明の一実施の形態に係るテロップ検出装置の構成例を示すブロック図である。 図5のサブブロックエッジ検出部の詳細な構成例を示す図である。 図5のテロップ領域検出部の詳細な構成例を示す図である。 テロップの文字の画像の輝度の変化の特性を説明する図である。 テロップではない画像の輝度の変化の特性を説明する図である。 テロップ検出処理の例を説明するフローチャートである。 サブブロックエッジ検出処理を説明するフローチャートである。 テロップ領域検出処理を説明するフローチャートである。 画像の中に表示されているテロップの画像の特徴量の分布を説明するグラフである。 従来の方式により、テロップが含まれるサブブロックを検出した場合と、本発明によりテロップが含まれるサブブロックを検出した場合とを比較したグラフである。 適合率と再現率を説明する図である。 適合率と再現率を説明する図である。 適合率と再現率を説明する図である。 パーソナルコンピュータの構成例を示すブロック図である。
符号の説明
200 テロップ検出装置, 201 領域抽出部, 202 サブブロックエッジ検出部, 203 テロップ領域検出部, 221 演算器, 222 演算器, 231 最小値抽出部, 232 最大値抽出部, 233 最小値抽出部, 234 最大値抽出部, 241 演算器, 242 演算器, 261 垂直フィルタ, 262 水平フィルタ, 271 乗算器, 272 乗算器, 273 加算器, 281 閾値判定部, 282 閾値判定部, 283 閾値判定部, 291 論理積演算器

Claims (7)

  1. 入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置であって、
    前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、
    前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、
    前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部と
    を備える検出装置。
  2. 注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第1の指標を抽出して、前記第1の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる水平フィルタにより処理して得られる水平処理データと、
    前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタにより処理して得られる垂直処理データとに基づいて、
    前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段をさらに備える
    請求項1に記載の検出装置。
  3. 前記テロップ情報出力手段は、
    前記水平処理データと、前記垂直処理データとに基づいて、斜処理データをさらに生成し、
    前記水平処理データの値が第1の閾値を超え、前記垂直処理データの値が第2の閾値を超え、かつ前記斜処理データの値が第3の閾値を超えた場合、前記注目するサブブロックに、テロップが含まれていると判定する
    請求項2に記載の検出装置。
  4. 前記水平フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、水平方向のストライプ模様の画像が含まれる場合、高い値の前記水平処理データが得られるように、前記数値が設定され、
    前記水平フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、垂直方向のストライプ模様の画像が含まれる場合、高い値の前記垂直処理データが得られるように、前記数値が設定される
    請求項2に記載の検出装置。
  5. 入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置の検出方法であって、
    前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し、
    前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出し、
    前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出するステップ
    を含む検出方法。
  6. 入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出処理をコンピュータに行わせるプログラムであって、
    コンピュータを、
    前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、
    前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、
    前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、
    前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部として機能させる
    プログラム。
  7. 請求項5に記載のプログラムが記録されている記録媒体。
JP2007129517A 2007-05-15 2007-05-15 検出装置および方法、プログラム、並びに記録媒体 Expired - Fee Related JP4967798B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007129517A JP4967798B2 (ja) 2007-05-15 2007-05-15 検出装置および方法、プログラム、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007129517A JP4967798B2 (ja) 2007-05-15 2007-05-15 検出装置および方法、プログラム、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2008287353A true JP2008287353A (ja) 2008-11-27
JP4967798B2 JP4967798B2 (ja) 2012-07-04

Family

ID=40147038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007129517A Expired - Fee Related JP4967798B2 (ja) 2007-05-15 2007-05-15 検出装置および方法、プログラム、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP4967798B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079559A1 (ja) * 2009-01-06 2010-07-15 日本電気株式会社 クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08125857A (ja) * 1994-10-27 1996-05-17 Sharp Corp 画像処理装置
JP2000156780A (ja) * 1998-11-20 2000-06-06 Toshiba Corp 画像処理装置
JP2002281299A (ja) * 2001-03-15 2002-09-27 Nec Corp 線分検出器
JP2007115133A (ja) * 2005-10-21 2007-05-10 Sharp Corp 画像処理装置、画像形成装置、画像読取装置、画像処理方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08125857A (ja) * 1994-10-27 1996-05-17 Sharp Corp 画像処理装置
JP2000156780A (ja) * 1998-11-20 2000-06-06 Toshiba Corp 画像処理装置
JP2002281299A (ja) * 2001-03-15 2002-09-27 Nec Corp 線分検出器
JP2007115133A (ja) * 2005-10-21 2007-05-10 Sharp Corp 画像処理装置、画像形成装置、画像読取装置、画像処理方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079559A1 (ja) * 2009-01-06 2010-07-15 日本電気株式会社 クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム
JP5445467B2 (ja) * 2009-01-06 2014-03-19 日本電気株式会社 クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム

Also Published As

Publication number Publication date
JP4967798B2 (ja) 2012-07-04

Similar Documents

Publication Publication Date Title
US20130058569A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US8644605B2 (en) Mapping colors of an image
JP6098319B2 (ja) 走査画像の処理方法及び装置
JP6642970B2 (ja) 注目領域検出装置、注目領域検出方法及びプログラム
KR101180570B1 (ko) 전경 영역 추출 프로그램, 전경 영역 추출 장치, 및 전경 영역 추출 방법
JP2012022654A (ja) 画像処理装置、画像処理方法、およびプログラム
EP2536123B1 (en) Image processing method and image processing apparatus
JP4967798B2 (ja) 検出装置および方法、プログラム、並びに記録媒体
US8805076B2 (en) Image processing apparatus, image processing method and computer readable medium
JP2010028429A (ja) 画像処理装置、画像処理方法およびプログラム
US8542922B2 (en) Image processing apparatus, image processing method, and computer readable medium
WO2012127639A1 (ja) 画像処理装置及び画像処理方法
KR101664185B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 기억 매체
JP4894664B2 (ja) 画像処理システム及び画像処理プログラム
JP2011090475A (ja) デジタル画像処理装置および背景色置換方法
JP2011053456A (ja) 画像表示方法、プログラム、画像表示装置、及び、この画像表示装置を有する撮像装置
KR101535196B1 (ko) 질감 특성을 고려한 영상 분할 장치 및 그 방법
JP4253265B2 (ja) 影検出装置、影検出方法及び影検出プログラム、影検出装置を用いた画像処理装置、影検出方法を用いた画像処理方法及び影検出プログラムを用いた画像処理プログラム
JP6241311B2 (ja) 画像処理装置及び画像処理プログラム
JP2009010819A (ja) 画像判別装置および方法、並びに、プログラム
JP2008098946A (ja) 画像処理装置及びその制御方法
Pristiwanto CANNY OPERATOR'S IMPLEMENTATION OF IMAGE SEGMENTATION
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP5562774B2 (ja) 図形修正装置
JPH1185976A (ja) 画像ノイズ分析方法および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees