JP4288909B2 - 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 - Google Patents
文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 Download PDFInfo
- Publication number
- JP4288909B2 JP4288909B2 JP2002220058A JP2002220058A JP4288909B2 JP 4288909 B2 JP4288909 B2 JP 4288909B2 JP 2002220058 A JP2002220058 A JP 2002220058A JP 2002220058 A JP2002220058 A JP 2002220058A JP 4288909 B2 JP4288909 B2 JP 4288909B2
- Authority
- JP
- Japan
- Prior art keywords
- character information
- frame image
- candidate
- appearance
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Studio Circuits (AREA)
Description
【発明の属する技術分野】
本発明は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置及びその方法並びにプログラム及び記録媒体に関し、特に、正確に文字情報を検出して提示することができる文字情報検出装置及びその方法並びにプログラム及び記録媒体に関する。
【0002】
【従来の技術】
従来、連続する画像中に出現する文字情報を重要な情報だと考え、それらを検出する技術がある。例えば、特開平10−40391号公報には、動画像を構成する複数のフレームの中から文字が含まれるフレームを抽出する文字出現フレーム抽出装置及び方法が開示されている(以下、従来例1という。)。
【0003】
この公報に記載の技術においては、映像中のテロップ文字又はフリップボード上の文字を投影した場合、文字が出現することにより前のフレームとの画素値に差が生じ、文字が出現した後、数フレームに亘って文字部分は変化が少ない点に着目し、動画像を構成する各フレームを部分矩形領域に分割し、前後の時刻の複数フレームとの間で対応する部分矩形領域内で輝度ヒストグラム差分値を算出し、各フレームと前後の時刻の複数のフレームとの間で求めた複数の輝度ヒストグラム差分値の中で、前の時刻の複数のフレームとの間で求めた差分値は、予め設定した第1の閾値よりも大きい値が1以上存在し、且つ後の時刻の複数のフレームとの間で求めた差分値は全ての値が予め設定した第2の閾値より小さいという条件を満たす部分矩形領域を有するフレームを文字出現フレームとして抽出するものである。
【0004】
また、特開平10−233994号公報には、テレビジョン放送における映像信号中のテロップのような特定領域を抽出する特定領域抽出装置が開示されている(以下、従来例2という。)。この公報に記載の特定領域抽出装置においては、テロップは、同一信号レベルで構成され、画素が所定の時間以上同一信号を保持し、背景となる画と信号レベルで大きな差があるという特徴を利用し、映像信号の任意の画素レベルと周辺画素レベルとを比較して略均一なレベル領域を検出する均一レベル領域検出手段と、任意の画素レベルが所定時間以上無変化であるか否かを判定する画素レベル無変化判定手段と、映像信号の任意の映像平面における周波数成分の高域を検出する高周波領域検出手段と、均一レベル領域検出手段、無変化判定手段及び高周波領域検出手段の各出力を基に特定領域を抽出する抽出手段とを備えている。
【0005】
【発明が解決しようとする課題】
しかしながら、従来技術において、様々なパターンの画像の変化から、テロップ等の文字情報を判別する技術について確立されたものは存在しない。例えば、従来例1に記載の技術においても使用されているように、頻繁に用いられる技術として画素単位やブロック単位のフレーム間差分、又はブロック単位での輝度ヒストグラムを計算し、得られた値を閾値処理する手法が挙げられるが、閾値の設定が原画像に依存してしまうため、背景画のわずかな動きを誤検出してしまう等の問題点がある。
【0006】
また、従来例2においては、均一レベル領域検出手段、無変化判定手段及び高周波領域検出手段の各出力を基に特定領域を抽出するため、演算量が多く処理に時間がかかるという問題点ある。
【0007】
本発明は、このような従来の実情に鑑みて提案されたものであり、連続する画像中で使用される文字情報を正確且つ迅速に特定してリアルタイムで自動検出することができる文字情報検出装置及びその方法並びにプログラム及び記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る文字情報検出装置は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置において、フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出手段と、上記文字情報出現フレーム画像の上記文字情報出現領域を文字情報候補とし、該文字情報候補を既検出文字情報候補として記憶する記憶手段と、上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出手段とを有することを特徴とする。
【0009】
本発明においては、フレーム画像に対して、予め文字情報が出現する可能性がある領域を文字情報出現領域として設定することからフレーム画像全体から文字情報を検出するよりもロバスト性を向上することができ、近接するフレーム間の輝度変化により文字情報出現領域の局所変化を検出し、これより文字情報の出現を検出することで画像上の小さな変化による誤検出を軽減することができ、更に、出現が検出された既検出文字情報候補とこれに連続する複数フレームの文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出することにより、文字情報をより精度よく検出することができる。
【0010】
本発明に係る文字情報検出装置は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置において、フレーム画像に予め文字情報出現領域を設定し、該文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出手段と、上記文字情報候補を既検出文字情報候補として記憶する記憶手段と、上記既検出文字情報候補と該既検出文字情報候補を有するフレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出手段とを有することを特徴とする。
【0011】
本発明においては、フレーム画像に対して、予め文字情報が出現する可能性がある領域を文字情報出現領域として設定することからフレーム画像全体から文字情報を検出するよりもロバスト性を向上することができ、更に、文字情報出現領域のエッジ密度が所定の閾値以上の文字情報出現領域を文字情報候補として検出して既検出文字情報として保持し、既検出文字情報候補とこれに連続する複数フレームの文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出することにより、文字情報をより精度よく検出することができる。
【0012】
本発明に係る文字情報検出装置は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置において、フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出手段と、上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出手段と、上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶手段と、上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報と推定する文字情報検出手段とを有することを特徴とする。
【0013】
本発明においては、フレーム画像に対して、予め文字情報が出現する可能性のある領域を文字情報出現領域として設定することからフレーム画像全体から文字情報を検出するよりもロバスト性を向上することができ、近接するフレーム間の輝度変化から文字情報出現領域の局所変化を検出して文字情報の出現を検出し、更に出現が検出された文字情報出現領域のエッジ密度から文字情報候補を検出することで画像上の小さな変化による誤検出を軽減することができ、更に、既検出文字情報候補とこれに連続する複数フレームの文字情報候補とのエッジ密度の変化の割合から文字情報を検出することにより、文字情報をより精度よく検出することができる。
【0014】
また、フレーム画像とこれに時間的に近接する近接フレーム画像との輝度変化を比較し、上記フレーム画像間の輝度変化が所定の閾値以下であるとき、該フレーム画像を候補フレーム画像として検出する候補フレーム画像検出手段を有し、上記文字情報出現フレーム画像検出手段は、上記候補フレーム画像とこれに時間的に近接する近接フレーム画像とを比較し、該候補フレーム画像から上記文字情報出現フレーム画像を検出することができ、候補フレーム画像の検出により、シーンチェンジ及び背景の大きな動き等による誤検出を軽減することできる。
【0015】
また、上記文字情報検出手段は、上記既検出文字情報候補が上記記憶手段に保持される期間を検出する期間検出手段と、上記文字情報候補と上記既検出文字情報候補との類似度を検出する類似度検出手段と、上記類似度が所定の閾値以上であって、上記既検出文字情報候補のエッジ密度よりも上記文字情報候補のエッジ密度の方が高いとき、及び上記類似度が上記所定の閾値未満であるとき、上記記憶手段の上記既検出文字情報候補を上記文字情報候補に入れ替える入替手段とを有し、上記記憶手段に所定期間保持された既検出文字情報候補を文字情報と推定することができ、類似度として例えば両者の輝度から相関係数等を求めて比較することにより、同一文字情報が検出されること防止することができ、入替手段により、上記既検出文字情報候補のエッジ密度よりも上記文字情報候補のエッジ密度の方が高いとき、及び/又は上記類似度が所定の閾値未満であるとき上記記憶手段の上記既検出文字情報候補を上記文字情報候補に入れ替えることに、より鮮明な文字情報を有する領域の方を既検出文字情報候補として検出することができ、期間検出手段により、既検出文字情報候補が保持される期間を検出するため、更に誤検出を低減することができる。
【0016】
更に、フレーム画像を予め規定したサイズのブロックに分割するブロック分割手段を有し、上記文字情報出現フレーム画像検出手段は、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域とで対応するブロック間の輝度変化が所定の閾値以上であるとき、該フレーム画像を局所変化フレーム画像として検出することができる。
【0017】
更にまた、上記ブロック分割手段により分割されたブロック毎に輝度ヒストグラムを算出する輝度ヒストグラム算出手段を有し、上記文字情報出現フレーム画像検出手段は、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域とで対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値以下であるブロックの数が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出することができる。
【0018】
また、上記検出手段により文字情報として検出された1以上の文字情報出現領域を、上記画像を表示する第1の表示手段とは異なる第2の表示手段に提示(表示)する提示手段を有することができる、これにより、例えば複数台のテレビ画面を同時に用いた場合、通常の放送が流れるメイン画面とは別の他の装置の画面に文字情報を提示することができ、使用者は、メイン画面でTV映像を見ながら他の画面に表示された文字情報を見ることができる。
【0019】
更に、上記提示手段は、複数の上記文字情報出現領域をリスト状にして他の画面に提示(表示)することができ、これにより、使用者は、刻々と変化する文字情報の内容の把握が容易になる。
【0020】
更にまた、入力フレーム画像より過去のフレーム画像が上記文字情報出現フレーム画像であるか否かを判定する判定手段を有し、上記文字情報出現フレーム画像検出手段は、上記過去のフレーム画像が上記文字情報出現フレーム画像ではない入力フレーム画像とこれに時間的に近接するフレーム画像とを比較し、該入力フレーム画像から上記文字情報出現フレーム画像を検出し、上記文字情報候補検出手段は、上記過去のフレーム画像が上記文字情報出現フレーム画像である入力フレーム画像又は上記文字情報出現フレーム画像の上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出することができ、上記過去のフレーム画像が上記文字情報出現フレーム画像である入力フレーム画像は、上記文字情報出現フレーム画像検出手段の処理を省略することができる。
【0021】
更に、上記文字情報出現領域は、1つのフレーム画像に対して複数設定されてもよく、文字情報出現領域は、動画像の種類等により、任意の場所に任意の個数設定することができる。
【0022】
本発明に係る文字情報検出方法は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出方法において、フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出工程と、上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出工程と、記憶手段に上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶工程と、上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出工程と有することを特徴とする。
【0023】
本発明に係るプログラム及び記録媒体は、連続するフレーム単位の画像が供給され該画像から文字情報を検出する動作をコンピュータに実行させるためのプログラム及びこれを記録したコンピュータ読み取り可能な記録媒体であって、フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出工程と、上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出工程と、記憶手段に上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶工程と、上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出工程と有することを特徴とする。
【0024】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、TV放送等の連続する画像中で重要な情報を表示(提示、呈示)する際に用いられる文字情報をリアルタイムに自動検出してリスト表示する文字情報検出装置に適用したものである。
【0025】
TV放送等において、文字情報(以下、テロップという。)は、制作者が重要だと判断した内容であって、視聴者に強く伝えたい情報であるといえる。そのため、テロップは、画面上の他の部分と区別しやすいよう工夫されており、以下に示す特徴を有すると考えられる。テロップが有する特徴とは、
1.テロップを構成する画素は高輝度である
2.文字の縁はエッジが急峻であるため、エッジ密度が高い
3.特徴的な出現形態をとる
4.出現した後、一定時間の安定状態を有する
5.特徴的な消失形態をとる
6.自然界に無い色が使用されている
7.情報の内容と出現場所とに関係がある
等である。これら全ての特徴を有することがテロップの必用条件ではないものの、多くのテロップがこれらの特徴のうち、数個の特徴を有すると考えられる。本願発明者等は、このようなテロップの特徴に着目し、テロップの高精度な抽出を実現する方法を見出した。
【0026】
本発明においては、上述したように、テロップは情報の内容と出現場所とに関係がある、即ち、情報内容によってテロップの出現位置は数種類のパターンに代表されることから、予め予測されるテロップの出現位置をテロップ出現領域として設定する。図1(a)乃至図1(e)は、テロップ出現領域を画面上に設定した例を示す模式図である。テロップ出現領域は、画面上で、テロップの出現が予測される任意の位置か又は目的に応じて検出したい所定の位置等に、例えば矩形又は帯状の領域として設定することができる。図1(a)は、画面中央にテロップ出現領域を設定した場合、図1(b)は、画面中央上部にテロップ出現領域を設定した場合、図1(c)は、画面中央下部にテロップ出現領域を設定した場合、図1(d)は、画面の4隅にテロップ出現領域を設定した場合、図1(e)は、画面側部にテロップ出現領域を設定した場合を示している。
【0027】
例えば、TV番組においては、画面中央に表示されるテロップとしては、番組タイトル又は各コーナタイトル等を示すものがあり、画面中央上部に表示されるテロップとしては、臨時ニュース等を示すものがある。また、画面中央下部に表示されるテロップとしては、解説又は出演者のコメント内容等を示すものがあり、画面4隅に表示されるテロップとしては、トピック内容又は時刻等を示すものがあり、画面側部に表示されるテロップとしては人物名等の固有名詞等を示すもの等がある。
【0028】
更に、本実施の形態においては、従来のテレビ視聴形態が1台のテレビを使用するものであることに対して、複数台のテレビ画面を同時に用い、通常の放送が流れるメイン画面の他に複数のサブ画面を用意する。そして、検出されたテロップをサブ画面にリスト状に表示し、その内容を一定期間保持することで、刻々と変化するテロップの内容を見落とさず、後に確認をすることも可能にする。
【0029】
図2は、文字情報を検出する処理を実行する装置を示すブロック図である。図2に示すように、装置1は、例えばCPU(central processing unit)等の中央処理装置2と、制御プログラム3を有するメインメモリ4と、データファイル5を有するファイル装置6と、入力装置7と、出力装置8とがバス9を介して接続されている。
【0030】
この装置1は、文字情報検出処理を行う手段を備えるものであって、装置入力装置7から供給される例えばテレビ番組等の動画像から文字情報(以下、テロップという。)を切り取り、例えば、入力装置から供給される動画像を表示するメイン画面とは異なる画面(サブ画面)を有する他のTV装置等の出力装置8に出力して提示することができる。メインメモリ4には、入力画像からテロップを切り取る処理を実行するための制御プログラム3が格納されており、中央処理装置2により制御されて制御プログラム3が実行される。以下、文字情報検出処理を行う手段について具体的に説明する。
【0031】
図3は、本発明の実施の形態に係る文字情報検出装置におけるデータの流れを説明する説明図である。図3に示すように、本実施の形態の文字情報検出装置は、入力画像データが供給されるフレーム画像判定部(判定手段)10と、フレーム画像判定部10からのデータが供給され、図1に示すような画面上に予め設定されたテロップ出現領域(文字情報出現領域)において、このテロップ出現領域にテロップが出現するか否かを検出するテロップ出現検出部(文字情報出現フレーム画像検出手段)20と、フレーム画像判定部10又はテロップ出現検出部20からフレーム画像が供給され、そのテロップ出現領域のエッジ密度が所定の閾値以上であるとき、このテロップ出現領域をテロップ候補として検出するエッジ密度検出部30と、エッジ密度検出部30により検出されたテロップ候補を既検出テロップ候補として記憶する記憶部40と、既検出テロップ候補がこの既検出テロップ候補を有するフレーム画像に時間的に連続する複数のフレーム画像におけるテロップ候補との輝度変化の割合が所定の閾値以下である静止期間を検出しこの静止期間が所定値に達したとき当該既検出テロップ候補をテロップと推定する推定部50と、推定部50により推定されたテロップ候補と、実際に提示済みのテロップとの類似度を比較し、類似していないテロップ候補のみをテロップとして出力するテロップ類似度検出部60と、テロップ類似度検出部60から出力されるテロップを保持し、複数のテロップを合成してリスト状にして提示画像を生成する提示画像生成部(提示手段)70とから構成されている。
【0032】
テロップ出現検出部20は、フレーム全体の輝度変化を検出する候補フレーム画像検出部21とテロップ出現領域の輝度変化を検出する局所変化検出部22とを有する。
【0033】
また、推定部50は、エッジ密度検出部30から供給されるデータと記憶部40に記憶されている既検出テロップ候補との類似度を比較する類似度検出部51と、既検出テロップ候補が記憶部40に保持される期間を検出する継続カウンタ52と、継続カウンタ52及び類似度検出部51からのデータに基づき既検出テロップ候補の安定度を判定する安定度判定部53から構成されている。
【0034】
以下、本実施の形態における文字情報検出装置ついて更に詳細に説明する。文字情報検出装置には、時系列のフレーム単位の画像データが入力される。ここで、後述するテロップ出現検出部20においてテロップ出現領域にテロップの出現が検出された時点及びエッジ密度検出部30でテロップ出現領域のエッジ密度が所定の閾値以上のもの(テロップ候補(候補ベクトル))が検出された時点で、これを示すフラグ(stateflg)に1が設定される。このフラグ(stateflg)は、その後のフレーム画像のテロップ出現領域がテロップ候補ではないと判定された時点、具体的には、後述するが、エッジ密度検出部30においてテロップ出現領域のエッジ密度が所定の閾値未満であることが検出された時点、テロップ類似度検出部60で同様の既に提示済みのテロップが検出された時点、及び提示画像生成部70からテロップと確定されて出力された時点で0が設定されるものである。
【0035】
フレーム画像判定部10は、入力フレーム(iフレーム)が入力された時点で、このフラグ(stateflg)が0であるか、又は1であるかにより、既に文字情報候補が検出されているか否かを判定するものである。上述した如く、テロップは出現した後、一定時間の安定状態を有することから、iフレームが入力された時点で、既に過去のフレームにおいてテロップの出現又はテロップ候補が検出されていれば、iフレームではテロップ出現中とみなすことができる。従って、テロップ出現検出部20における処理は不要であるため、フラグ(stateflg)が1である間は、フレーム画像をエッジ密度検出部30に供給する。
【0036】
テロップ出現検出部20は、フラグ(stateflg)が0である間、判定部10からフレーム画像が供給される。そして、時間的に近接するフレーム画像間の輝度変化からテロップ出現領域におけるテロップの出現を検出するものである。入力フレーム(iフレーム)テロップ出現領域の輝度と、時間的に近接する例えば(i−2)フレームのテロップ出現領域との輝度とを比較すれば、iフレームテロップ出現領域にテロップが出現する場合、その輝度が変化するため、この輝度変化を検出することにより、iフレームテロップ出現領域にテロップが出現するか否かが判定できる。
【0037】
ここで、テロップ出現領域のみの輝度変化を検出すると、例えばシーンチェンジ等のようにフレーム全体の輝度が変化している場合にもテロップ出現領域の輝度変化が検出されてしまう。これを防止するため、候補フレーム画像検出部21により、近接フレーム画像間のフレーム全体の輝度変化を調べ、この輝度変化が所定の閾値以下であるものを局所変化検出部22に供給する。
【0038】
そして、局所変化検出部22は、近接フレームのテロップ出現領域間で輝度の局所変化を検出し、この輝度変化が所定の閾値以上であれば、テロップが出現するものと判断し、フラグ(stateflg)に1を立てると共に、このフレーム画像(文字情報出現フレーム画像)をエッジ密度検出部30に供給する。
【0039】
次に、候補フレーム画像検出部21及び局所変化検出部22について具体的に説明する。候補フレーム画像検出部21は、例えば図4のように構成された輝度ヒストグラム生成部80に対して入力フレーム画像を送り、フレーム全体の輝度ヒストグラムを利用して候補フレーム画像を検出することができる。輝度ヒストグラム生成部80は、フレーム画像判定部10からのフレーム画像のデータ(以下、フレームデータという。)が供給されるブロック分割部81及び遅延回路83、遅延回路83により所定時間遅延されたフレームデータが供給されるブロック分割部84、並びに、ブロック分割部81及び84により所定のサイズのブロックに分割されたフレームデータが供給されブロック毎の輝度ヒストグラムを計算する夫々ヒストグラム計算部82及び85から構成されている。
【0040】
このように構成された輝度ヒストグラム生成部80に対して、候補フレーム画像検出部21が、フレーム画像判定部10から供給されるiフレームの画像データを供給する。輝度ヒストグラム生成部80は、ブロック分割部81により、供給されたiフレームの画像データ(情報列)を空間が規定サイズとなるブロックに分割し、このブロック単位のデータをヒストグラム計算部82に送る。
【0041】
また、このiフレームの画像データは、同時に遅延回路83にも供給され、遅延回路83により、例えば2フレーム分遅延された画像データがブロック分割部24に供給される。
【0042】
ブロック分割部84は、ブロック分割部81と同様に、(i−2)フレームの画像データ(情報列)を空間の規定サイズブロックに分割し、このブロック単位のデータをヒストグラム計算部85に送る。
【0043】
ヒストグラム計算部82,85は、全画面において、ブロック単位で輝度ヒストグラムを計算し、この結果を候補フレーム画像検出部21に送る。
【0044】
そして、候補フレーム画像検出部21は、ヒストグラム計算部82,85からのデータ、即ち、iフレームのブロック単位の輝度ヒストグラムと、(i−2)フレームのブロック単位の輝度ヒストグラムとが供給されると、iフレームと(i−2)フレームとの間において、空間的に対応するブロック毎に輝度ヒストグラムの相関係数を求め、予め決められた閾値(Th_coef1)と比較し、相関係数が所定の閾値(Th_coef1)以下であるブロックを変化ブロックと判定する。下記式(1)に相関係数を求める際の式を示す。
【0045】
【数1】
【0046】
そして、この変化ブロックの割合が所定の閾値(Th_diff1)以下であるiフレームを候補フレーム画像として検出する。ここで、変化ブロックの割合が閾値(Th_diff1)より大きい場合は、現フレーム(iフレーム)の処理を終了し、次のフレーム((i+1)フレーム)の処理へ進む。
【0047】
また、局所変化検出部22も、候補フレーム画像検出部21と同様に、候補フレーム画像検出部21により検出されたiフレーム及び(i−2)フレームのデータが供給され、両者の上記文字情報出現領域において、候補フレーム画像検出部21と同様に、空間的に対応するブロック毎に輝度ヒストグラムの相関係数が所定の閾値(Th_coef1)以下である変化ブロックの割合が所定の閾値(Th_diff2)以上であるiフレームを検出する。ここで変化ブロックの割合が所定の閾値(Th_diff2)以上であった場合は、上述した如くフラグ(stateflg)に1を立てると共にこのデータをエッジ密度検出部30に供給する。一方、変化ブロックの割合が閾値(Th_diff2)より小さい場合は、現フレーム(iフレーム)の処理を終了し、次のフレーム((i+1)フレーム)の処理へ進む。これは近接するフレームの文字情報出現領域間の変化が小さい場合は、iフレームのテロップ出現領域においてテロップの出現は検出されなかったと判断し、このフレームについての後段の処理を省略するためである。
【0048】
このように、テロップ出現検出部20によって、全ブロック中の変化ブロックの割合とテロップ出現領域における変化ブロックの割合とを計算し、全ブロック中の変化ブロックの割合が予め決めた閾値以下であり、且つ、テロップ出現領域における変化ブロックの割合が予め決めた閾値以上である場合は、局所変化が存在する、即ち、テロップの出現と判定することができる。
【0049】
なお、本実施の形態においては、輝度ヒストグラム生成部80を用意し、候補フレーム画像検出部21の要求に応じて輝度ヒストグラムを生成するものとしたが、候補フレーム画像検出部21及び局所変化検出部22において、図4に示すようなブロック分割部81,84及びヒストグラム計算部82,85等を個別に有するものとしてもよい。また、遅延回路83による遅延時間は、2フレーム分としたが、例えば1フレーム又は3フレーム等、フレーム間の変化の割合を検出することができる範囲で任意に設定可能である。
【0050】
図3に戻って、エッジ密度検出部30は、フラグ(stateflg)が1である間、フレーム画像か供給され、このテロップ出現領域のエッジ密度を計算する。なお、ここで、エッジ密度検出部30に供給される画像データは、フレーム全体のデータであっても、テロップ出現領域のみのデータであってもよい。
【0051】
エッジ密度検出部30は、このフレーム画像のテロップ出現領域のエッジ密度が所定の閾値以上であるとき、当該テロップ出現領域をテロップ候補として検出する文字情報候補検出手段である。即ち、フレーム画像のテロップ出現領域におけるエッジ密度を算出し、上述したように、テロップであれば、エッジ密度が高いという特徴から、テロップ出現領域のエッジ密度が所定の閾値(Th_den)以上のものをテロップ候補として検出する。ここで、テロップ出現領域のエッジ密度が所定の閾値(Th_den)未満であるときは、フラグ(stateflg)を0とする。これにより、以降のフレーム画像は、フラグ(stateflg)に1が設定されるまでの間、テロップ出現検出部20に供給されるようになる。
【0052】
記憶部40には、エッジ密度検出部30において検出されたテロップ候補が既検出テロップ候補として記憶される。即ち、現フレーム(iフレーム)より過去のフレームにおいてテロップ候補として検出されたテロップ出現領域のデータが既検出テロップ候補として記憶されており、後述する推定部50において、この既検出テロップ候補と、この既検出テロップ候補と時間的に連続する所定数のフレームにおいて検出されたテロップ候補とが比較されることにより、既検出テロップ候補がテロップであるか否かが推定される。即ち、既検出テロップ候補を有するフレームに時間的に連続するフレームにおいてエッジ密度検出部30によりテロップ候補が検出されなかった場合は、その時点で既検出テロップ候補は不要となる。従って、既検出テロップ候補を有するフレームに時間的に連続するフレームにおいてエッジ密度検出部30によりテロップ候補が検出されなかった場合、エッジ密度検出部30は、記憶部40に記憶されている既検出テロップ候補を初期化(破棄)し、後述する継続カウンタ52のカウント値をリセットし、フラグ(stateflg)を0とし、次のフレームの処理へ移る。
【0053】
推定部50は、記憶部40に保持されている既検出テロップ候補と、この既検出テロップ候補を有するフレーム画像に連続する所定数のフレーム画像におけるテロップ候補とのエッジ密度の変化の割合が所定の閾値以下であるとき、当該既検出テロップ候補をテロップと推定する検出手段である。
【0054】
継続カウンタ52は、テロップが安定して出現したフレーム数(静止期間)をカウントするものである。例えば、エッジ密度検出部30及び後述する類似度検出部51等において、記憶部40に記憶されている既検出テロップ候補は、これに続くフレームのテロップ候補と比較されることにより、既検出テロップ候補がテロップとしての特徴から外れる場合は、テロップ候補と置き換えられ、このとき、継続カウンタ52のカウント値がリセットされる。上述したように、テロップであれば、数フレームは安定して出現することから、継続カウンタ52により、記憶部40に記憶されている既検出テロップ候補が置き換えられることなく保持される連続フレーム数をカウントする。推定部50は、このカウント値から既検出テロップ候補がテロップであるか否かを最終的に推定するものである。
【0055】
類似度検出部51は、既検出テロップ候補と、これより後(未来)のフレームにおいて検出されたテロップ候補との類似度を検出する類似度検出手段である。即ち、エッジ密度検出部30により検出されたエッジ密度が所定の閾値以上であるテロップ出現領域(テロップ候補)が供給され、このテロップ候補と、上記既検出テロップ候補との相関を比較する。具体的には、上述の候補フレーム画像検出部21及び局所変化検出部22と同様に、空間的に対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値(Th_coef2)以上である場合、テロップ候補のテロップと、既検出テロップ候補のテロップとは、同一のものであると判断する。この場合は、更に、テロップ候補のエッジ密度と、既検出テロップ候補のエッジ密度とを比較し、両者のうち、エッジ密度が高い方のデータを既検出テロップ候補とする。即ち、既検出テロップ候補のエッジ密度の方が高ければ、記憶部40に記憶されているデータはそのまま保持されるが、テロップ候補の方がエッジ密度が高い場合は、記憶部40のデータ(既検出テロップ候補)をテロップ候補のデータと置き換える。このように、エッジ密度が高いものを選択することにより、より鮮明なものを抽出することができる。
【0056】
ここで、記憶部40に記憶されている既検出テロップ候補が置き換えられた(書き換えられた)場合は、継続カウンタ52のカウント値をリセットする。一方、記憶部40に記憶されている既検出テロップ候補をそのまま保持した場合は、継続カウンタ52のカウント値をインクリメントする。
【0057】
また、相関係数が所定の閾値(Th_coef2)未満である場合、iフレームテロップ出現領域に出現している可能性のあるテロップは、既検出テロップ候補に出現している可能性のあるテロップとは異なるものと判定され、iフレームテロップ出現領域のデータを記憶部40に供給し、記憶されている既検出テロップ候補をiフレームテロップ出現領域のデータに置き換えると共に、継続カウンタ52のカウント値をリセットする。
【0058】
このように、類似度検出部51は、テロップ候補と、記憶部40に記憶された既検出テロップ候補との類似度が所定の閾値以上であって、既検出テロップ候補のエッジ密度よりテロップ候補のエッジ密度の方が高いとき、また、上記類似度が所定の閾値未満であるとき、記憶部40の既検出テロップ候補をiフレームのテロップ候補に入れ替える入替手段としても機能する。
【0059】
安定度判定部53は、既検出テロップ候補が記憶部40に保持される期間を検出する期間検出手段として、継続カウンタ52のカウント値を検出する。上述したように、テロップであれば、数フレーム間は安定に出現することから、カウント値が予め設定された所定値である場合に、記憶部40に記憶されている既検出テロップ候補がテロップであると推定し、これをテロップ類似度判定部60に送る。一方、カウント値が所定値以外、例えば所定値未満である場合は、この既検出テロップ候補がテロップとしての安定度が低いと判定し、また所定値より大きい場合は、既にテロップ類似度判定部60に送られたものと判定し、記憶部40の既検出テロップ候補及び継続カウンタ52のカウント値を保持しつつ、次のフレームの処理へ進む。ここで、カウント値が所定値未満であった場合、以降のフレーム処理により、カウント値がインクリメントされ所定値に達した場合は、この既検出テロップ候補がテロップと推定されて類似度検出部60に送られる。
【0060】
また、既検出テロップ候補をテロップと推定してテロップ類似度検出部60に送出した後は、記憶部40に記憶されている既検出テロップ候補、及び継続カウンタ52のカウント値はそのまま保持することにより、以降のフレームにおいて、この既検出テロップ候補と同一のテロップ候補が検出され、カウンタ値がインクリメントされれば、カウンタ値が所定値より大きくなるため、テロップ類似度検出部60には送出されず、同一のテロップを出力することを防止することができる。
【0061】
テロップ類似度検出部60は、安定度判定部53により、既検出テロップ候補がテロップと推定された既検出テロップ候補と、既に提示されているテロップとを比較しその類似度が所定の閾値以下であるとき、当該既検出テロップ候補をテロップとして検出する文字情報検出手段である。即ち、既にテロップと判定され、例えば既に提示されたテロップ、又は、後述する提示画像生成部70に保持されているテロップ等の既検出テロップと、安定度判定部53によりテロップであると判定された既検出テロップ候補とを比較し、既検出テロップと類似していない既検出テロップ候補のみ検出し、これをテロップとして提示画像生成部70に送る。これにより、既検出テロップ候補が既にテロップとして判定され出力されているものと同じ場合には出力しないようにすることができる。このテロップ類似度判定部60により、既検出テロップ候補が既にテロップとして出力されていると判定された場合は、この既検出テロップ候補のデータを初期化し、次のフレームの処理に進む。
【0062】
提示画像生成部70は、類似度判定部60により検出された1以上の既検出テロップを合成し提示画像を生成して他の画面に表示する提示手段である。提示画像生成部70は、所定数のテロップを保持して表示し続けるため、テロップの出現領域が例えば水平方向の帯状の領域に設定されている場合、この帯状の領域を切出し、例えは垂直方向に並べることでリスト表示を行っている。新しいテロップが検出される度に既存テロップをスクロールし、画像を更新して出力する。
【0063】
このように、文字情報検出装置は、先ず、テロップ出現検出部20により、入力画像データの輝度変化からテロップの出現を検出し、エッジ密度検出部30により、出現を検出した文字情報出現領域のエッジ密度からテロップ゜候補を検出し、推定部50により、テロップ候補の出現している期間を検出することによりテロップ候補が確実にテロップであるか否かを推定し、必要に応じて類似度類似度判定部60を設け、これによりテロップが何度も検出されないようにして、提示画像を生成するものである。
【0064】
以下、本実施の形態における文字情報検出方法について詳細に説明する。図5は、図3に示すフレーム画像判定部10及びテロップ出現検出部20の処理方法を示すフローチャートである。上述したように、文字情報を検出する際には、例えば図1に示すように、予めテロップ出現領域を画面上に設定する。以下の説明においては、図1(c)に示すように、テロップ出現領域を画面下部に設定した場合について説明する。なお、複数のテロップ出現領域を設定する場合は、各テロップ出現領域について同様の処理を行うものとする。
【0065】
図5に示すように、図3のフレーム画像判定部10にiフレームの画素値F(i,pxl)が入力されると、上述したフラグ(stateflg)が1であるか0であるかが検出される(ステップS1)。ここで、フラグ(stateflg)が1である間は、後述するステップ9に進む。一方、フラグ(stateflg)が0である間は、ステップS2及びS3に進む。
【0066】
ステップS2では、ヒストグラム生成部80のヒストグラム計算部85から(i−2)フレームの全画面においてブロック単位で計算された輝度ヒストグラムH(i−2,j)を読み込む。ここで、jは、フレーム内のj番目のブロック(ブロックNo.)を示し、輝度ヒストグラムH(i−2,j)は、(i−2)フレームにおけるj番目のブロックの輝度ヒストグラムを示す。このとき、同時に、ヒストグラム計算部82で、iフレームの全画面において、ブロック毎の輝度ヒストグラムが計算され、このiフレームにおける輝度ヒストグラムH(i,j)がフレーム変化検出部26に供給される(ステップS3)。本実施の形態においては、フレーム画像を例えば720×480ピクセル等とすることができ、ブロックサイズを例えば32×32ピクセル等とすることができる。
【0067】
次に、ステップS4では、局所変化検出部26が、輝度ヒストグラムH(i−2,j)と輝度ヒストグラムH(i,j)とから対応ブロック毎に相関係数e1(j)を計算し、この相関係数e1(j)と所定の閾値(Th_coef1)とを比較し、相関係数e1(j)が、閾値(Th_coef1)以下であれば、変化ブロックと判定する。
【0068】
そして、ステップS4で判定した全ブロックに対する変化ブロックの割合e1(j)が、所定の閾値(Th_diff1)以下であるか否かを判定し(ステップS5)、閾値(Th_diff1)より大きい場合は、現フレームの処理を終了し、次のフレームの処理へ進む。一方、変化ブロックの割合e1(j)が閾値(Th_diff1)以下である場合は、ステップS6に進む。
【0069】
ステップS6では、局所変化検出部22において、ヒストグラム計算部82,85からのデータにより、フレーム内のテロップ出現領域、即ち、本実施の形態の場合は、例えば64×576ピクセルのサイズを有する画面中央下部領域内の全ブロックに対する変化ブロックの割合e2(j)を計算し、ステップS7において、変化ブロックの割合e2(j)が所定の閾値(Th_diff2)以上であるか否かを判定する。変化ブロックの割合e2(j)が所定の閾値(Th_diff2)未満である場合は、現フレームの処理を終了して、次のフレームの処理へ進む。一方、変化ブロックの割合e2(j)が所定の閾値(Th_diff2)以上である場合は、ステップS8に進み、iフレームのテロップ出現領域はテロップ候補であるとみなし、テロップ候補が検出されたことを示すフラグ(stateflg)に1をたて、iフレームの画素値F(i,pxl)を推定部50へ送る。これにより、以降のフレーム画像の処理は、フラグ(stateflg)が1である間は、ステップS2乃至ステップS8の処理を行わず、ステップS1からステップS9に進む処理がなされることになる。
【0070】
次に、ヒストグラム生成部80において、輝度ヒストグラムを計算する方法について更に詳細に説明する。図6は、ヒストグラム生成部80によりブロック単位で計算された輝度ヒストグラムから候補フレーム画像を検出する方法を示すブローチャートである。
【0071】
図6に示すように、先ず、ブロック分割部81にiフレームの画像データが入力され、このフレーム画像データを規定サイズ、例えば、32×32ピクセルのサイズのブロックに分割する(ステップS21)。ブロック分割されたデータはヒストグラム計算部82に送られ、ここで、j番目のブロックの輝度ヒストグラムH(i,j)を計算する(ステップS22)。次に、ヒストグラム計算部85から、(i−2)フレームのj番目のブロックの輝度ヒストグラムH(i−2,j)を読み込む(ステップS23)。
【0072】
次に、ステップS22で得られた輝度ヒストグラムH(i,j)と、ステップS23で得られた輝度ヒストグラムH(i−2,j)とから、上記式(1)により、ヒストグラムの相関係数e1(j)を計算し(ステップS24)、閾値(Th_coef1)により変化を判定する(ステップS25)。この変化の判定には、例えばフラグE(i,j)を使用し、iフレームのj番目のブロックは変化がある(変化ブロック)と判定された場合は、フラグE(i,j)=1とし、変化ブロックではないと判定された場合は、フラグE(i,j)=0とする。そして、(i+2)フレームのフレーム変化を検出する際に使用するため、H(i,j)を保持すると共に、候補フレーム画像検出部21内のブロックNo.をカウントするカウンタ値jをインクリメントする(ステップS26)。そして、全ブロックについて、ステップS25の閾値判定が終了しているか否かを判定し(ステップS26)、終了していない場合は、ステップS22に戻り、次のブロック(j+1番目のブロック)について、同様の処理を繰り返す。
【0073】
一方、全てのブロックにおいて処理が終了した場合は、上述したように、変化ブロックの割合が所定の閾値より大きければ、現フレーム(iフレーム)の処理を終了し、次のフレームの処理へ進み、変化ブロックの割合が所定の閾値以下である場合は、局所変化検出部22へデータを供給する。具体的には、全ブロックのフラグE(i,j)の値を加算し、これが所定の閾値より大きい場合は処理を終了し、所定の閾値以下である場合は、局所変化検出部22へデータを供給する。 局所変化検出部22においても、基本的には、ステップS22乃至27と同様の処理が繰り返される。即ち、テロップ出現領域内のブロック単位の輝度ヒストグラムH(i,j)及びH(i−2,j)が順次読み込まれ、テロップ出現領域内の変化ブロックを検出する処理を行う。
【0074】
次に、推定部50における既検出テロップ候補がテロップか否かを推定する方法について説明する。図7は、推定部の推定方法を示すフローチャートである。先ず、フラグ(stateflg)=1の間、画像データがエッジ密度検出部30に送られる。ここでは、エッジ密度検出部30に送られる画像データをiフレームとする。先ず、図7に示すように、エッジ密度検出部30において、iフレームにおけるテロップ出現領域におけるエッジ画像の密度d(i)が計算される(ステップS9)。このエッジ密度d(i)が所定の閾値(Th_den)以上であるか否かが検出され(ステップS10)、エッジ密度d(i)が閾値(Th_den)未満である場合は、ステップS11に進み、記憶部40に記憶されている既検出テロップ候補を初期化、即ち、データを破棄し、継続カウンタ52のカウント値をリセットし、更にテロップ候補が検出されていることを示すフラグ(stateflg)を0にする(ステップS11)。これにより、以降のフレーム画像は、フラグ(stateflg)が1になるまで、ステップS2乃至ステップS8を繰り替えすことになる。一方、iフレームのテロップ出現領域のエッジ密度d(i)が閾値(Th_den)以上である場合は、データを類似度検出部51へ送り、ステップS12に進む。
【0075】
ステップS12では、類似度検出部51において、記憶部40に記憶されている既検出テロップ候補と、iフレームのテロップ出現領域との相関係数e(tlp)を計算する。そして、相関係数e(tlp)が所定の閾値(Th_coef2)以上であるか否かを判定する(ステップS13)。ステップS13で、相関係数e(tlp)が所定の閾値(Th_coef2)以上であると判定された場合、即ち、既検出テロップ候補とiフレームのテロップ出現領域とは同一のテロップを有するものと判定された場合はステップS14に進み、記憶部40に記憶されている既検出テロップ候補のエッジ密度d(tlp)と、iフレームのテロップ出現領域のエッジ密度d(i)とが比較される(ステップS14)。そして、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)以上であるか否かが判定され(ステップS15)、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)以上である場合、即ち、既検出テロップ候補の方がiフレームのテロップ出現領域に出現する可能性のあるテロップよりも鮮明であると判定された場合は、ステップS17に進む。
【0076】
一方、ステップS13において、既検出テロップ候補とiフレームのテロップ出現領域との相関係数e(tlp)が所定の閾値(Th_coef2)未満である場合、即ち、iフレームのテロップ出現領域と既検出テロップ候補とでテロップが変化しているものと判断した場合と、ステップS15において、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)より小さい場合、即ち、既検出テロップ候補よりもiフレームのテロップ出現領域に出現する可能性があるテロップの方が、エッジ密度が高く鮮明であると判断した場合は、ステップS16に進む。ステップS16では、記憶部40に記憶されている既検出テロップ候補が、現フレーム、即ち、iフレームのテロップ出現領域のデータに入れ替えられる。具体的には、既検出テロップ候補のエッジ密度d(tlp)を、iフレームのテロップ出現領域のエッジ密度d(i)に入れ替え、更に継続カウンタ52のカウント値をリセット(tlplen=0)し、ステップS17に進む。
【0077】
ステップS17においては、継続カウンタ52のカウント値をインクリメント(tlplen=++)し、ステップS18において、継続カウンタ52のカウント値(tlplen)が所定値(Th_tlplen)であるか否かが判定される。
【0078】
上述したように、テロップであれば、一定フレームの間、安定して出現する。継続カウンタ52のカウント値は、テロップが安定して出現したフレーム数を示すものである。従って、ステップS18において、カウント値が所定値(Th_tlplen)以外であると判定された場合は、カウント値及び既検出テロップ候補のデータを保持して次のフレームの処理へ進む。
【0079】
一方、カウント値が所定値(Th_tlplen)である場合、即ち、既検出テロップ候補が所定のフレーム数、出現し続けていると判定された場合は、このデータがテロップ類似度判定部60へ送られてステップS19に進む。この際、記憶部40に保持されている既検出テロップ候補及び継続カウンタ52のカウント値はそのまま保持する。
【0080】
ステップS19では、例えば、提示画像生成部70等に保持されている既にテロップと判定されものと、既検出テロップ候補との相関係数を計算し、ステップS20にて、相関係数が所定の閾値以下であるか否かが判定される。ステップS20にて相関係数が所定の閾値以下である場合、既検出テロップ候補は、まだテロップとして検出されていない新しいテロップであると判断され、このデータを提示画像生成部70へ送る。一方、相関係数が所定の閾値より大きい場合は、既検出テロップ候補に出現するテロップは既にテロップとして出力されていると判断され、次のフレームの処理に進む。
【0081】
ここで、ステップS18及びステップS19において、安定度判定部53及びテロップ類似度検出部60の夫々判定結果及び検出結果に関わらず、記憶部40の既検出テロップ候補のデータはそのまま保持され、且つ継続カウンタ52のカウンタ値もそのまま保持されているため、例えば、次に入力されるフレーム画像において同じテロップ候補が検出され、このテロップ候補のエッジ密度が既検出テロップ候補のエッジ密度より小さい場合は、継続カウンタ52のカウンタ値がインクリメントされ、所定値(Th_tlplen)を超えるため、再びテロップ類似度検出部60に送られることはない。また、テロップ候補のエッジ密度が既検出テロップ候補のエッジ密度より大きい場合は、既検出テロップ候補が置き換えられ、継続カウンタのカウント値が1となり、カウント値が所定値(Th_tlplen)に達するまで処理が繰り返される。
【0082】
以上、図7に示す工程において、記憶部40には、既検出テロップ候補が記憶されているものとして説明したが、図5に示すステップS5、ステップS8において、iフレームにおいてテロップ候補が検出されなかった場合、記憶部40に記憶されている既検出テロップ候補は初期化(破棄)される。このように、記憶部40には、既検出テロップ候補が記憶されていない状態で、推定部50にテロップ候補を有するフレーム画像が供給された場合、図7に示すステップS12乃至ステップS15における処理は不要となる。従って、既検出テロップ候補が初期化された状態でステップS10においてエッジ密度が所定の閾値以上であると判定された場合は、ステップS16に進み、フレーム画像のテロップ出現領域のデータが既検出テロップ候補として記憶される。そして、同様に、ステップS17において、継続カウンタtlplen=1として、次のフレームの処理に進む。
【0083】
図8は、提示画像生成部70において生成される提示画像の一例を示す模式図である。図8(a)に示すように、通常のTV映像が表示されるメイン装置90において、例えば画面中央下部に表示されるテロップ91を、上述の方法により切り取り、リスト状にして、図8(b)に示すように、サブ画面を有する装置92上に表示することができる。
【0084】
本実施の形態においては、テロップ出現検出部20において異なるフレーム間におけるブロック単位の輝度ヒストグラムの相関を用いてテロップ出現領域における輝度変化(局所変化)を求めることで画像上の小さな変化等による誤検出を軽減することが可能となると共に、シーンチェンジ及び背景の大きな動き等による誤検出を軽減することが可能となる。また、エッジ密度検出部30によるエッジ密度を判定条件に用いることで、文字情報(テロップ)を更に精度よく検出することが可能となる。更に、類似度判定部51により、既検出テロップ候補とこれに連続するフレームのテロップ出現領域における類似度を判定すると共に、継続カウンタ52により継続して出現するフレーム数をカウントし、更に、テロップ類似度検出部60により既検出テロップとの類似度を判定することで、細かいテロップの変化等の場合にも、同内容のテロップを誤検出することを軽減することができる。更にまた、複数台のTVを用いて、提示画像生成部70により映像を表示するTVとは別の画面にテロップをリスト状に表示し、一定時間保持することにより、一般に重要であるが刻々と変化するテロップの情報を見落とさず視聴することができ、且つテロップを後から見直すことができ、使用者の理解を容易にすることができる。
【0085】
【発明の効果】
以上詳細に説明したように本発明によれば、連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置において、フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出手段と、上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出手段と、上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶手段と、上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出手段とを有するので、画像上の小さな変化の誤検出を軽減することができ、更に、文字情報候補のエッジ密度と、文字情報候補の変化の期間を判定条件に用いることで、文字情報をより精度よく検出することができる。
【図面の簡単な説明】
【図1】(a)乃至(e)は、テロップ出現領域を画面上に設定した例を示す模式図である。
【図2】本発明の実施の形態の文字情報検出装置を示すブロック図である。
【図3】本発明の実施の形態に係る文字情報検出装置の制御プログラムにおけるデータの流れを説明する説明図である。
【図4】輝度ヒストグラムを生成する際のデータの流れを説明する説明図である。
【図5】本発明の実施の形態の文字情報検出方法を示す図であって、フレーム画像判定部10及びテロップ出現検出部20の処理方法を示すフローチャートである。
【図6】同じく、本発明の実施の形態の文字情報検出方法を示す図であって、輝度ヒストグラムからフレーム変化を検出する方法を示すブローチャートである。
【図7】同じく、本発明の実施の形態の文字情報検出方法を示す図であって、既検出テロップ候補がテロップか否かを推定する方法を示すブローチャートである。
【図8】本発明の実施の形態における文字情報検出装置の提示画像生成部で生成される提示画像の一例を示す模式図である。
【符号の説明】
1 文字情報検出装置、2 中央処理装置、3 制御プログラム、4 メインメモリ、5 データファイル、6 ファイル装置、7 入力装置、8 出力装置、9 バス、10 判定部、20 テロップ出現検出部、21 候補フレーム画像検出部、22 局所変化検出部、30 エッジ密度検出部、40 記憶部、50 推定部、51 類似度検出部、52 継続カウンタ、53 安定度判定部、60 テロップ類似度検出部、70 提示画像生成部、80 ヒストグラム生成部、81,84 ブロック分割部、82,85 ヒストグラム計算部
Claims (18)
- 連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出装置において、
フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出手段と、
上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出手段と、
上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶手段と、
上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報と推定する文字情報検出手段と
を有する文字情報検出装置。 - フレーム画像とこれに時間的に近接する近接フレーム画像との輝度変化を比較し、上記フレーム画像間の輝度変化が所定の閾値以下であるとき、該フレーム画像を候補フレーム画像として検出する候補フレーム画像検出手段を有し、
上記文字情報出現フレーム画像検出手段は、上記候補フレーム画像とこれに時間的に近接する近接フレーム画像とを比較し、該候補フレーム画像から上記文字情報出現フレーム画像を検出する
請求項1記載の文字情報検出装置。 - 上記文字情報検出手段は、上記既検出文字情報候補が上記記憶手段に保持される期間を検出する期間検出手段と、上記既検出文字情報候補のエッジ密度よりも上記文字情報候補のエッジ密度の方が高いとき、上記記憶手段の上記既検出文字情報候補を上記文字情報候補に入れ替える入替手段とを有し、
上記記憶手段に所定期間保持された既検出文字情報候補を文字情報と推定する
請求項1記載の文字情報検出装置。 - 上記文字情報検出手段は、上記既検出文字情報候補が上記記憶手段に保持される期間を検出する期間検出手段と、上記文字情報候補と上記既検出文字情報候補との類似度を検出する類似度検出手段と、上記類似度が所定の閾値以上であって、上記既検出文字情報候補のエッジ密度よりも上記文字情報候補のエッジ密度の方が高いとき、及び上記類似度が上記所定の閾値未満であるとき、上記記憶手段の上記既検出文字情報候補を上記文字情報候補に入れ替える入替手段とを有し、
上記記憶手段に所定期間保持された既検出文字情報候補を文字情報と推定する
請求項1記載の文字情報検出装置。 - 上記類似度検出手段は、上記文字情報候補と上記既検出文字情報候補との輝度変化を検出する
請求項4記載の文字情報検出装置。 - フレーム画像を予め規定したサイズのブロックに分割するブロック分割手段を有し、
上記文字情報出現フレーム画像検出手段は、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域とで対応するブロック間の輝度変化が所定の閾値以上であるとき、該フレーム画像を局所変化フレーム画像として検出する
請求項1記載の文字情報検出装置。 - 上記ブロック分割手段により分割されたブロック毎に輝度ヒストグラムを算出する輝度ヒストグラム算出手段を有し、
上記文字情報出現フレーム画像検出手段は、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域とで対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値以下であるブロックの数が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する
請求項6記載の文字情報検出装置。 - フレーム画像を予め規定したサイズのブロックに分割するブロック分割手段を有し、
上記候補フレーム画像検出手段は、フレーム画像とこれに時間的に近接する近接フレーム画像とで対応するブロック間の変化が所定の閾値以下であるとき、該フレーム画像を候補フレーム画像として検出する
請求項2記載の文字情報検出装置。 - 上記ブロック分割手段により分割されたブロック毎に輝度ヒストグラムを算出する輝度ヒストグラム算出手段を有し、
上記候補フレーム画像検出手段は、フレーム画像とこれに時間的に近接する近接フレーム画像とで対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値以下であるブロックの数が所定の閾値以下であるとき、該フレーム画像を候補フレーム画像として検出する
請求項8記載の文字情報検出装置。 - 上記文字情報検出手段の後段に、上記文字情報検出手段により文字情報と推定された既検出文字情報候補と既に提示されている文字情報とを比較しその類似度が所定の閾値以下であるとき、該既検出文字情報候補を文字情報と確定する文字情報類似度検出手段を有する
請求項1記載の文字情報検出装置。 - 上記文字情報検出手段により文字情報として検出された1以上の文字情報出現領域を、上記画像を表示する第1の表示手段とは異なる第2の表示手段に提示する提示手段を有する
請求項1記載の文字情報検出装置。 - 上記提示手段は、複数の上記文字情報出現領域をリスト状にして他の画面に提示する
請求項11記載の文字情報検出装置。 - 入力フレーム画像より過去のフレーム画像が上記文字情報出現フレーム画像であるか否かを判定する判定手段を有し、
上記文字情報出現フレーム画像検出手段は、上記過去のフレーム画像が上記文字情報出現フレーム画像ではない入力フレーム画像とこれに時間的に近接するフレーム画像とを比較し、該入力フレーム画像から上記文字情報出現フレーム画像を検出し、
上記文字情報候補検出手段は、上記過去のフレーム画像が上記文字情報出現フレーム画像である入力フレーム画像又は上記文字情報出現フレーム画像の上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する
請求項1記載の文字情報検出装置。 - 入力フレーム画像より過去のフレーム画像が上記文字情報候補を有するか否かを判定する判定手段を有し、
上記文字情報出現フレーム画像検出手段は、上記過去のフレーム画像に上記文字情報候補がない入力フレーム画像とこれに時間的に近接するフレーム画像とを比較し、該入力フレーム画像から上記文字情報出現フレーム画像を検出し、
上記文字情報候補検出手段は、上記過去のフレーム画像に上記文字情報候補を有する入力フレーム画像又は上記文字情報出現フレーム画像の上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する
請求項1記載の文字情報検出装置。 - 上記文字情報出現領域は、1つのフレーム画像に対して複数設定されることを特徴とする請求項1記載の文字情報検出装置。
- 連続するフレーム単位の画像が供給され該画像から文字情報を検出する文字情報検出方法において、
フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出工程と、
上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出工程と、
記憶手段に上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶工程と、
上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出工程と
を有する文字情報検出方法。 - 連続するフレーム単位の画像が供給され該画像から文字情報を検出する動作をコンピュータに実行させるためのプログラムにおいて、
フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出工程と、
上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出工程と、
記憶手段に上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶工程と、
上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出工程と
を有するプログラム。 - 連続するフレーム単位の画像が供給され該画像から文字情報を検出する動作をコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体において、
フレーム画像に予め文字情報出現領域を設定し、フレーム画像の上記文字情報出現領域とこれに時間的に近接する近接フレーム画像の上記文字情報出現領域との輝度変化を比較し、上記文字情報出現領域間の輝度変化が所定の閾値以上であるとき、該フレーム画像を文字情報出現フレーム画像として検出する文字情報出現フレーム画像検出工程と、
上記文字情報出現領域のエッジ密度が所定の閾値以上であるとき、該文字情報出現領域を文字情報候補として検出する文字情報候補検出工程と、
記憶手段に上記文字情報出現フレーム画像の上記文字情報候補を既検出文字情報候補として記憶する記憶工程と、
上記既検出文字情報候補と該既検出文字情報候補を有する文字情報出現フレーム画像に時間的に連続する複数のフレーム画像における上記文字情報候補との輝度変化の割合が所定の閾値以下である静止期間を検出し該静止期間が所定値に達したとき該既検出文字情報候補を文字情報として検出する文字情報検出工程と
を有するプログラムが記録された記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002220058A JP4288909B2 (ja) | 2002-07-29 | 2002-07-29 | 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002220058A JP4288909B2 (ja) | 2002-07-29 | 2002-07-29 | 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004064431A JP2004064431A (ja) | 2004-02-26 |
JP4288909B2 true JP4288909B2 (ja) | 2009-07-01 |
Family
ID=31940806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002220058A Expired - Fee Related JP4288909B2 (ja) | 2002-07-29 | 2002-07-29 | 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4288909B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4253327B2 (ja) | 2006-03-24 | 2009-04-08 | 株式会社東芝 | 字幕検出装置及び字幕検出方法ならびにプルダウン信号検出装置 |
JP2008085700A (ja) * | 2006-09-28 | 2008-04-10 | Sanyo Electric Co Ltd | 映像再生装置及び再生用プログラム |
JP4965980B2 (ja) * | 2006-11-30 | 2012-07-04 | 株式会社東芝 | 字幕検出装置 |
KR20110084730A (ko) * | 2010-01-18 | 2011-07-26 | 삼성전자주식회사 | 액정표시장치 및 이의 구동 방법 |
JP5677229B2 (ja) * | 2011-07-28 | 2015-02-25 | 日本放送協会 | 映像字幕検出装置およびそのプログラム |
WO2014097814A1 (ja) * | 2012-12-20 | 2014-06-26 | シャープ株式会社 | 表示装置、入力装置、情報提示装置、プログラムおよび記録媒体 |
-
2002
- 2002-07-29 JP JP2002220058A patent/JP4288909B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004064431A (ja) | 2004-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4620163B2 (ja) | 静止字幕検出装置、静止字幕を含む画像を表示する映像機器、および静止字幕を含んだ画像の処理方法 | |
US8743290B2 (en) | Apparatus and method of processing image as well as apparatus and method of generating reproduction information with display position control using eye direction | |
JP4267649B2 (ja) | ビデオ番組の処理方法、関連装置及び関連媒体 | |
US20090051819A1 (en) | Video display device, interpolated image generation circuit and interpolated image generation method | |
JP4288909B2 (ja) | 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体 | |
JP4244584B2 (ja) | 重要画像検出装置、重要画像検出方法、プログラム及び記録媒体並びに重要画像検出システム | |
TW201524197A (zh) | 多媒體系統之視窗偵測裝置與方法 | |
JP2016119552A (ja) | 映像コンテンツ処理装置、映像コンテンツ処理方法及びプログラム | |
JPWO2010064319A1 (ja) | 映像表示制御装置、映像表示装置、そのプログラムおよびそのプログラムを記録した記録媒体 | |
JP2004080156A (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体並びに画像処理システム | |
EP1484763A1 (en) | Music program contents menu creation apparatus and method | |
JP4614613B2 (ja) | 特定情報検出装置、特定情報検出方法、プログラム、及び記録媒体並びに特定情報検出システム | |
CN115297313A (zh) | 微显示动态补偿方法及系统 | |
US8502922B2 (en) | Multimedia device and play mode determination method of the same | |
JPH07236153A (ja) | 動画像のカット点検出およびカット画面グループ検出装置 | |
JP5188272B2 (ja) | 映像処理装置及び映像表示装置 | |
JP4433719B2 (ja) | 画像表示装置の焼き付き防止装置及び画像表示装置の焼き付き防止方法 | |
JP3024574B2 (ja) | 動画像検索装置 | |
JP2004072504A (ja) | 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム | |
US8730398B2 (en) | Video output apparatus and control method therefor, and non-transitory recording (storing) medium that records program | |
CN113453071B (zh) | 数据叠加方法、装置及电子设备 | |
JP4930364B2 (ja) | 映像文字検出方法、装置、およびプログラム | |
JP4788787B2 (ja) | 特定画像検出装置、特定画像検出方法、プログラム及び特定画像検出システム | |
WO2009024966A2 (en) | Method for adapting media for viewing on small display screens | |
JP4292762B2 (ja) | 特定画像検出装置、特定画像検出方法、プログラム及び記録媒体、並びに特定画像検出システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050630 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080318 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090310 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090323 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120410 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130410 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140410 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |