JP5424737B2 - 画像再生装置 - Google Patents

画像再生装置 Download PDF

Info

Publication number
JP5424737B2
JP5424737B2 JP2009148303A JP2009148303A JP5424737B2 JP 5424737 B2 JP5424737 B2 JP 5424737B2 JP 2009148303 A JP2009148303 A JP 2009148303A JP 2009148303 A JP2009148303 A JP 2009148303A JP 5424737 B2 JP5424737 B2 JP 5424737B2
Authority
JP
Japan
Prior art keywords
feature
image
area
information
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009148303A
Other languages
English (en)
Other versions
JP2011009816A5 (ja
JP2011009816A (ja
Inventor
直樹 木津
美樹 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2009148303A priority Critical patent/JP5424737B2/ja
Publication of JP2011009816A publication Critical patent/JP2011009816A/ja
Publication of JP2011009816A5 publication Critical patent/JP2011009816A5/ja
Application granted granted Critical
Publication of JP5424737B2 publication Critical patent/JP5424737B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

この発明は、動画像から抽出したスポーツ番組のスコアなどの特徴画像を、オリジナルの画像と共に表示する画像再生装置に関し、特に、見逃した過去の特徴領域画像データを表示させる技術に関する。
ワンセグ放送などの映像を携帯電話のような小さな液晶画面で見る場合、スポーツ番組のスコアや歌番組の歌詞、ニュース番組のテロップなどの文字情報が小さすぎて読みづらいという問題がある。また、警告音などの音声によって地震情報などの緊急情報が表示されているのを認識したにも関わらず、その内容を見逃したり情報が読みづらかったりして内容を理解できないことがある。
文字情報が小さすぎて読みづらいという問題に対して、例えば特許文献1は、文字領域を抽出して拡大表示することや、文字領域の色相を変更して見易く表示することを提案している。
特開平9−91453号公報
ワンセグ放送などの映像を視聴する際、小さな画面ではスポーツ番組のスコアなどの文字情報が小さくて読みづらいという問題がある。又、その情報をたまたま見逃してしまい、内容を認識できないことがある。
特許文献1の技術によれば、文字領域を拡大表示することによって読みづらい文字情報を確認することが出来るが、見逃した過去の文字情報を再び表示させる技術については開示されていない。
又、文字などの特徴画像を抽出する際に、特徴画像領域以外の領域をも誤検出してしまう場合があり、誤検出を含んだ領域に画像処理を行ってオリジナル画像に貼り付けて表示した場合、不自然な映像となり視聴者に不快感を与えてしまう。
そこで、本発明は上述の問題点に鑑み、動画像から抽出した特徴画像をオリジナル画像と共に表示する際、過去の特徴画像の表示を可能にすると共に、望ましくは誤検出を軽減し、使用者の利便性を高める画像再生装置を提供することを目的とする。
本発明の画像再生装置は、入力映像から所定の画像処理により特徴画像を抽出する特徴画像抽出手段と、特徴画像抽出手段が抽出した特徴画像の入力映像上の領域である特徴領域の情報を特徴領域情報として蓄積する特徴領域情報保持手段と、指定された表示画面上の表示座標系での位置を入力映像上の映像座標系の指定位置に変換して指定位置情報として出力する制御手段と、過去の特徴領域情報の中から指定位置を含む特徴領域に対応する特徴領域情報を指定特徴領域情報として選択する処理対象領域決定手段と、指定特徴領域情報の特徴領域の画像を指定領域画像として取得する領域画像取得手段と、指定領域画像を入力映像の再生映像にオーバーレイ処理する出力処理手段と、を備え、特徴画像抽出手段は、入力映像から特徴ブロックを検出する特徴ブロック検出手段と、検出された特徴ブロックのフレーム方向の変化および検出された特徴ブロックの周辺画素の変化のうち少なくとも一方の変化に基づいて検出対象とする特徴ブロックか否かを判断する誤検出除去手段とを有し、検出対象とすると判断した特徴ブロックから特徴画像を抽出する。
本発明の画像再生装置は、入力映像から所定の画像処理により特徴画像を抽出する特徴画像抽出手段と、特徴画像抽出手段が抽出した特徴画像の入力映像上の領域である特徴領域の情報を特徴領域情報として蓄積する特徴領域情報保持手段と、指定された表示画面上の表示座標系での位置を入力映像上の映像座標系の指定位置に変換して指定位置情報として出力する制御手段と、過去の特徴領域情報の中から指定位置を含む特徴領域に対応する特徴領域情報を指定特徴領域情報として選択する処理対象領域決定手段と、指定特徴領域情報の特徴領域の画像を指定領域画像として取得する領域画像取得手段と、指定領域画像を入力映像の再生映像にオーバーレイ処理する出力処理手段と、を備え、特徴画像抽出手段は、入力映像から特徴ブロックを検出する特徴ブロック検出手段と、検出された特徴ブロックのフレーム方向の変化および検出された特徴ブロックの周辺画素の変化のうち少なくとも一方の変化に基づいて検出対象とする特徴ブロックか否かを判断する誤検出除去手段とを有し、検出対象とすると判断した特徴ブロックから特徴画像を抽出する。これにより、見逃した特徴画像を再び表示させることが可能になる。
実施の形態1に係る画像再生装置の構成の概略を示すブロック図である。 実施の形態1において特徴領域を抽出する過程を示す図である。 実施の形態2に係る画像再生装置の構成の概略を示すブロック図である。 実施の形態2において特徴領域を抽出する過程を示す図である。 実施の形態2における誤検出除去手段の動作を示す図である。 実施の形態3に係る画像再生装置の構成の概略を示すブロック図である。 実施の形態3における処理対象領域決定手段の動作を示す図である。 実施の形態3における特徴領域情報保持手段の動作を示す図である。 実施の形態4に係る画像再生装置の構成の概略を示すブロック図である。 実施の形態4におけるユーザインタフェースの一例を示す図である。
(実施の形態1)
<構成>
図1は、実施の形態1の画像再生装置の構成を概略的に示すブロック図である。画像再生装置は、フレームメモリ制御手段3、特徴ブロック検出手段4、特徴領域整形手段6、特徴領域情報保持手段7、処理対象領域決定手段8、領域画像取得手段13、制御手段10、出力処理手段11を備えている。特徴ブロック検出手段4と特徴領域整形手段6で特徴画像抽出手段100が構成される。さらに、画像再生装置は映像入力手段1、フレームメモリ2、表示手段12を備えるが、これらは画像再生装置の構成要素でなくても良い。
映像入力手段1は、ワンセグの映像ストリームのようにMPEG2、MPEG4などによって符号化された情報を復号した動画像を、1フレーム単位のオリジナル画像データ(フレームデータ)として一旦フレームメモリ2に記録する。フレームデータでは、RGB、つまり赤(R)・緑(G)・青(B)の組み合わせや、YUV、つまり輝度(Y)と色差(輝度と青の差(U)、輝度と赤の差(V))の組み合わせなどで色を表現している。
フレームメモリ制御手段3は、SDRAM等のフレームメモリ2へのアクセスタイミングやアクセスするデータのアドレスを受け、フレームメモリ2内のデータを読み書きできるようにするインタフェースである。
特徴ブロック検出手段4は、フレームメモリ制御手段3がフレームメモリ2から読み出したフレームデータから特徴ブロックを検出する。ここで、特徴ブロックとは1つ以上の画素から構成され、フレームデータから所定の画像処理によって検出される特徴画像を表す画素ブロックのことである。又、特徴画像とは、例えばテレビ放送でフレームインする地震情報などのスーパーや、歌番組の歌詞などの文字情報、スポーツ中継番組におけるスコアのような、フレームデータ間で画像情報が類似する領域の画像を指す。本実施の形態では、このような文字等が表示される文字領域の画像を特徴画像とする。
特徴領域整形手段6は、文字領域検出手段4からのデータを受け、検出された特徴ブロックに対して膨張・収縮(オープニング・クロージング)等の処理を行い、特徴ブロックが密集している部分を一つの特徴領域とみなし、その特徴領域に外接する矩形に整形する。ただし、矩形以外の形に整形しても良い。そして、矩形に整形した特徴領域のフレーム画像上での位置情報を、特徴領域情報として特徴領域情報保持手段7に出力する。以上のように、特徴ブロック検出手段4と特徴領域整形手段6はフレームデータから特徴画像の領域を抽出する特徴画像抽出手段100として機能する。
特徴領域情報保持手段7は、特徴領域整形手段6から特徴領域情報を受け、これを出現回数と共に蓄積しテーブル化する。理想的には、CM以外のテレビ放送において上記動作を行う。表示手段12は、例えば携帯電話の表示画面等のタッチパネルであり、取得したい特徴画像が表示されている/表示されていた領域を、使用者が直接タッチすることにより指定する。
制御手段10は、使用者が指定した領域の表示画面上の位置情報を表示画面座標系の位置情報として検出し、これを入力される映像上の入力映像座標系での位置情報である指定位置情報に変換して出力する。処理対象領域決定手段8は、制御手段10から指定位置情報を受け、特徴領域情報保持手段7内のテーブルに格納されている過去の特徴領域情報の中から指定位置情報を含む指定特徴領域情報を抽出し、指定特徴領域情報が有する特徴領域を処理対象領域とする。指定特徴領域情報が複数抽出される場合には、制御情報や装置の仕様に従い時間的に最も直近のもの、あるいは最も古いもの等の条件に合う一つの特徴領域を処理対象領域として決定する。
領域画像取得手段13は、処理対象領域決定手段8で決定された処理対象領域に相当する特徴領域画像データを指定領域画像としてフレームメモリ2から読み出し、出力処理手段11に出力する。出力処理手段11は、フレームメモリ2から読み出したフレームデータと領域画像取得手段13からの指定領域画像データをオーバーレイ処理して、表示手段12に表示する。
なお、フレームデータを記憶する手段として上記ではフレームメモリ2を示したが、他の記憶手段であっても良い。
<特徴画像領域の抽出>
次に、画像再生装置の動作を説明する。図2は、フレームデータのオリジナル画像から特徴画像を抽出する特徴画像抽出手段100の処理を示す図である。
特徴ブロック検出手段4は、フレームメモリ2から読み出したフレームデータから特徴ブロックを検出する。ところで、文字情報などの特徴画像はオリジナルのコンテンツ画像に貼り付けられて表示されるため、コンテンツ画像とは異なり殆ど動かないことが特徴である。そのため、現在のフレームと時間的に一つ(又は複数)前のフレームとを比較し変化の有無を観察することにより、特徴ブロックであるか否かを判定できる。
具体的には、フレームメモリ2からフレームメモリ制御手段3を介して読み出されたフレームデータ(図2(a))の、例えば輝度信号(Y)からフレーム画像データ全体のエッジ(輪郭)を抽出し、エッジの明瞭度(エッジ強度)を所定の複数の画素(例えば4×4画素)で構成される画素ブロック毎に蓄積加算する。
対象画素ブロックのエッジ強度の和が予め設定された閾値より大きく、かつ前フレームで同じ位置にある画素ブロックでのエッジ強度の和との差が小さい場合、その画素ブロックには文字などの特徴画素が含まれると判断して、その画素ブロックを特徴ブロックとして検出する。検出した特徴ブロックのみを残したフレーム画像が図2(b)である。図2(b)において、黒い部分は文字等の特徴画像があるものと判断された特徴ブロックを示す。
図2(b)に示すように、文字領域では特徴ブロックが密集する傾向にあるが、文字間の空白や行間ではエッジが検出されないため、検出された領域は穴あき状態となる。そこで、特徴領域整形手段6は検出された文字領域に対して膨張・収縮(オープニング・クロージング)等の整形処理を行い、密集した特徴ブロックの塊を一つの特徴領域とみなし、その特徴領域に外接する矩形の位置情報を算出する。整形後のフレーム画像を図2(c)に示す。図中、黒色の部分が特徴領域である。さらに、対象とする文字領域の性質から領域の大きさや形状による選別を行い、最終的には検出した矩形領域の境界を表す位置情報(特徴領域情報)を出力する。
<処理対象領域の決定>
特徴領域情報保持手段7は特徴領域整形手段6から特徴領域情報を受け、これをその出現回数と共に蓄積しテーブル化する。本発明で対象とする文字情報や画像情報は、オリジナルの映像に影響を与えないよう画面の下方やコーナー部のような決められた位置に表示されることが多く、この周辺の領域が特徴領域情報保持手段7のテーブルにおいて多く出現する傾向がある。
使用者がタッチパネルなどの表示手段12上の所望する領域を選択・指示すると、制御手段10は、選択・指示された場所の液晶画面(表示手段12)における表示座標系の位置情報を検出し、これを実際のワンセグ映像座標系の位置情報(指定アドレス)に変換し指定位置情報として処理対象領域決定手段8に送る。
ワンセグ映像(ワイドワンセグ)は320×240画素であり、これを携帯電話などに使用する高精細な液晶(VGA:640×480画素、WVGA:800×480画素)で表示する場合、実際には、ワンセグの映像に対して拡大処理を行っている。例えば、WVGAの液晶では、映像自体は水平方向2.67倍、垂直方向2.5倍、もしくは、水平方向、垂直方向とも2.5倍の拡大表示を行っている。このため、液晶画面上の位置と実際のワンセグ映像の位置は異なっており、変換処理を行う必要がある。
処理対象領域決定手段8は、特徴領域情報保持手段7内のテーブルに格納される特徴領域情報の中から、制御手段10から出力される指定位置情報を含んでいるものを検索し指定特徴領域情報として抽出する。
<領域画像取得手段>
領域画像取得手段13は、処理対象領域決定手段8で決定され出力される特徴領域の特徴領域情報(指定特徴領域情報)に従い、対応する特徴領域画像データ(指定領域画像データ)をフレームメモリ2から読み出す。フレームメモリ2では、順次入力されるフレームデータを識別子と共に複数保持しており、この中から処理対象領域情報に対応するフレームデータ、つまりタイムスタンプあるいはフレーム番号といった時間方向の識別子が一致するフレームデータを抽出し、さらに抽出したフレームデータの画像平面上の特徴画像領域に相当する特徴領域画像データ(指定領域画像データ)を取得し、出力する。
ここでは、指定領域画像データをフレームメモリ2から読み出し出力処理手段11へ出力するような構成としたが、読み出した指定領域画像データをフレームメモリ2の所定の位置へ再度書き込み、出力処理手段11でフレームデータと指定領域画像データの両方をフレームメモリ2から読み出す構成としてもよい。
また、フレームメモリ2では順次入力されるフレームデータ全体を保持する構成としたが、フレームメモリ2とは別の小メモリを設け、特徴画像抽出手段100の出力として特徴領域情報が決定した時点で、特徴領域に対応する部分画像データのみを保持させ、領域画像取得手段13は、この小メモリに保持する部分画像データから必要なデータを読み出すような構成としてもよい。
出力処理手段11は、入力される映像のフレームデータを表示手段12へ出力する。既に表示が完了したフレームデータに対して、使用者から特徴画像を再表示するよう指定があった場合、出力処理手段11は制御手段10から制御情報を受け、フレームデータに領域画像取得手段13からの特徴領域画像データをオーバーレイして出力する。オーバーレイする位置は、特徴領域画像データが表示されていた位置と同じとしてもよいし、表示画面内で指定する特定の位置を制御情報として受け取り、オーバーレイする位置を決定してもよい。
<効果>
実施の形態1の画像再生装置によれば、以下の効果を奏する。すなわち、実施の形態1の画像再生装置は、入力映像から所定の画像処理により特徴画像を抽出する特徴画像抽出手段100と、特徴画像抽出手段100が抽出した特徴画像の入力映像上の領域である特徴領域の情報を特徴領域情報として蓄積する特徴領域情報保持手段7と、指定された表示画面上の表示座標系での位置を入力映像上の映像座標系の指定位置に変換して指定位置情報として出力する制御手段10と、過去の特徴領域情報の中から指定位置を含む特徴領域に対応する特徴領域情報を指定特徴領域情報として選択する処理対象領域決定手段8と、指定特徴領域情報の特徴領域の画像を指定領域画像として取得する領域画像取得手段13と、指定領域画像を入力映像の再生映像にオーバーレイ処理する出力処理手段11と、を備える。これにより、見逃した特徴画像を再び表示させることが可能になる。
又、特徴領域情報は特徴画像と特徴画像の境界を表す境界情報を有し、処理対象領域決定手段8は、境界情報によって指定位置を含むことを判断し、領域画像取得手段は、特徴領域情報の特徴画像を指定領域画像とすることを特徴とする。これにより、見逃した特徴画像を再び表示させることが可能になる。
又、入力映像の各フレーム画像を識別子と共に記憶するフレームメモリ2(記憶手段)をさらに備え、特徴領域情報は、抽出元のフレーム画像の識別子を有し、領域画像取得手段13は、指定特徴領域情報の識別子に対応するフレームメモリ2に記憶されたフレーム画像のうち境界情報が示す部分を指定領域画像として取得する。これにより、見逃した特徴画像を再び表示させることが可能になる。
(実施の形態2)
<構成>
図3は、本発明の実施の形態2における画像再生装置の構成を示す概略ブロック図であり、図1と比較して、特徴画像抽出手段100に誤検出除去手段5を新たに設けている点が異なる。誤検出除去手段5は、特徴画像抽出手段100での特徴画像抽出処理において、誤検出を除去する。
<動作>
次に、本実施の形態での特徴画像抽出手段100の動作について説明する。図4は、特徴画像抽出手段100の処理を示す図である。
特徴ブロック検出手段4は、使用する動作アルゴリズムや画像処理パラメータの設定内容の違いなどによって、その出力である検出結果が変化する。例えば、図4(a)の画像に対して特徴ブロック検出手段4の出力として図4(b)の結果が得られた場合、検出された特徴ブロックは実際の文字領域よりも多くなる。文字領域ではない部分での動きが激しい映像では文字領域の検出精度は高いが、文字領域以外でも動きの少ない映像では、図4(b)に示すように、背景を構成する線分のようなエッジ強度の強い画像部分は特徴ブロックとして検出され、誤検出が発生する。そこで誤検出除去手段5によって、誤検出を除去する。
<誤検出除去手段5>
次に誤検出除去手段5の動作について詳細に説明する。誤検出除去手段5は、特徴ブロック検出手段4からのデータを受け、特徴画像領域の誤検出を除去する。
一般に文字の輪郭部分は値の変化が大きく高周波成分が多いため、特徴ブロック検出手段4において検出されるエッジの数が文字領域では単純な自然画像より多くなるという特徴がある。そこで、特徴ブロックであるか否かの判定に使用するエッジ数の閾値を大きくすることで誤検出をいくらか減らすことができる。あるいは、(1)文字領域挿入タイミングを検知する、(2)線分を排除する、という方法又はこれらの方法を組み合わせて誤検出を除去することも出来る。
(1)文字領域挿入タイミングの検知による誤検出除去方法について説明する。文字領域には入力される映像の内容によって、番組の最初から最後まで常に表示されるようなもの、番組途中で表示・非表示が切り替わるようなもの、内容を変更しつつ表示されるようなもの等がある。自然画像であれば、シーンチェンジでない限り画像内容の変化は一般的に滑らかであるが、表示されない期間のある文字領域について自然画像に挿入される文字領域付近では、挿入する文字が目立つようにすることもあって表示が開始される前後で大きく画素値が異なる場合が多い。そこで、局所的にフレームデータの輝度値やエッジ強度値などのヒストグラムを取得し、入力される映像フレーム間でヒストグラムを比較し、ヒストグラムが変化した領域と変化タイミングを捉えることで、文字領域が表示画面内に挿入されたと考えられる領域を動的に検出し、その領域以外で検出された特徴ブロックは誤検出と判断して除去する。
具体的には、画像全体のエッジ強度を取得し、画像を例えば4×4画素等の画素ブロックに分割する。そして、各画素ブロックで所定の閾値を超えるエッジ強度を持つ画素数をカウントする。次に、複数の画素ブロックからなる局所領域(例えば4×4画素ブロック)を設定し、各画素ブロックについて前述の所定の閾値を超えるエッジ強度を持つ画素数のヒストグラムを作成する。この局所領域のヒストグラムをフレーム間で比較することにより、文字領域が挿入されるタイミングを検出する。検出のための条件として以下に示す条件(A1)〜(A3)、(B1)〜(B3)を設定する。(A1):代表値(ヒストグラムの平均値、中間値など)が大きい局所領域が部分的に密集している、(A2):密集している局所領域の代表値のばらつきが小さい、(A3):ヒストグラムの形状が前フレームと比べて大きく変化している、(B1):局所領域の代表値と前フレームで対応する位置の局所領域の代表値との差が小さい、(B2):ヒストグラムの形状が前フレームと比べて変化が小さい、(B3):フレーム内には(B1)(B2)を満たさない局所領域もある。
なお、これらの条件は適宜閾値を設定して値の大小を比較することにより、条件を満たすか否かを判定する。
(A1)〜(A3)を満たすフレームがあれば、当該フレームから文字領域が挿入された可能性が高いと考えることができ、(B1)〜(B3)を満たすフレームがあれば、画面全体ではなく部分的に同じ画像が継続している可能性が高いといえる。よって、前フレームでの結果が(A1)〜(A3)を満たし、現フレームの結果が(B1)〜(B3)を満たしていれば、この変化があった局所領域の集合部分に前フレームのタイミングで文字領域が挿入されたと考えられ、その領域以外で検出された特徴ブロックは誤検出と判断することが出来る。
次に、(2)線分の排除による誤検出除去方法について説明する。入力された映像の背景にコントラストの強い線分がある場合、特徴ブロック検出手段4でのエッジ強度抽出の方法によっては、線分の太さの両端でエッジを抽出することになり、図4(b)で示したように背景にある線分が文字領域と同様にエッジが密集した特徴ブロックとして検出される。こうした現象は、スポーツ中継番組での競技場の白線や広告看板の周辺などで発生しやすい。
そこで、一般的に表示される文字領域は文字列間にある空白により、水平あるいは垂直の方向に途切れることなく極端に長くはならないという性質を用いて、不要に検出された線分を排除し特徴ブロックとして抽出されないようにする。具体的には、特徴ブロック検出手段4のエッジ強度を抽出した段階で、エッジ強度がある閾値より大きい画素列が、所定の方向に所定の閾値より長く連接している場合は、その画素列のエッジ強度を小さくする、あるいは特徴ブロック検出対象から除外する。
具体的には、図5に示すように、文字領域候補のエッジ情報を抽出し、さらに所定の閾値で2値化することにより、例えばエッジのある画素は“1”、エッジのない画素は“0”で表されるフレームデータを得る。そして、このフレームデータを水平方向のライン毎に走査し、連続する“1”の数をカウントすることにより、所定の閾値より長い線分の有無を調べる。長い線分(対象ライン)があれば、当該線分の幅で上下1ラインずつの線分(計3本)からなる矩形領域を設定し、矩形領域内の “1”の数をカウントし、“1”の面積を算出する。この“1”の面積が矩形領域に占める割合が高ければ、エッジが密集していると考えられるので文字領域を構成する成分であると判定し(図5(a))、そうでなければ不要な線分であると判定する。不要な成分であると判定されれば、その成分の値を全て“0”に変更する(図5(b))。
なお、対象ラインの上下1ラインを含めて矩形領域を設定したが、エッジが密集している領域の上端又は下端に対象ラインが位置する場合もあるため、対象ラインを上端あるいは下端に据えた矩形領域を設定しても良い。また、“1”が連続するものを線分としてカウントしているが、2値化処理における1画素程度の抜けを想定し、当該抜けを“1”で埋める処理を行っても良い。
このような方法により誤検出を除去した後のフレーム画像を図4(c)に示す。図4(b)と比較して、文字ではない部分の誤検出が減っており、線分が文字領域として誤検出されるのを防いでいる。
特徴領域整形手段6は、誤検出除去手段5からのデータを受け、誤検出除去後の特徴ブロックに対して膨張・収縮(オープニング・クロージング)等の処理を行い、特徴ブロックが密集している部分を一つの特徴領域とみなし、その特徴領域に外接する矩形に整形する。整形後のフレーム画像を図4(d)に示す。図中、黒色の部分が特徴領域である。ただし、矩形以外の形に整形しても良い。そして、矩形に整形した特徴領域のフレーム画像上での位置情報を、特徴領域情報として特徴領域情報保持手段7に出力する。これ以降の動作は実施の形態1と同様であるため、説明を省略する。
<効果>
実施の形態2の画像再生装置によれば、以下の効果を奏する。すなわち、実施の形態2の画像再生装置において、特徴画像抽出手段100は、フレーム画像の局所ヒストグラムをフレーム間で比較することにより、入力映像上に特徴画像が出現するタイミングと出現領域を検出し、出現領域以外で抽出される特徴画像を誤検出として除去する誤検出除去手段5を備える。これにより、特徴画像の検出処理における誤検出を除去できるので、特徴画像をオリジナル画像にオーバーレイ表示した際に、視聴者に不快感を与えることがない。
あるいは、特徴画像抽出手段100は、特徴領域として特定された領域のうち、エッジ強度の大きさが所定の基準を満たす画素あるいは画素ブロックが所定の方向に所定の閾値を超えて連続して並ぶ領域を誤検出として除去する誤検出除去手段5を備える。これにより、特徴画像の検出処理における誤検出を除去できるので、特徴画像をオリジナル画像にオーバーレイ表示した際に、視聴者に不快感を与えることがない。
(実施の形態3)
<構成>
図6は、本発明の実施の形態3における画像再生装置の構成を示す概略ブロック図であり、図3に示した実施の形態2と比較して、特徴画像抽出手段100から特徴領域情報保持手段7へ検出判定情報が出力されている部分が異なる。
<動作>
実際に入力される映像中に文字が表示されるときは1フレームに限られることはなく、数10フレーム、時間にして数秒程度以上の期間にわたる場合が多い。その場合、特徴画像抽出手段100によって文字表示期間中は重複して何度も文字領域を検出することが出来る。しかしながら、毎回必ず同じ領域を正確に検出できるとは限らず、特徴領域情報保持手段7に蓄積されている特徴領域情報は、検出の際の誤差を含んでおり、ばらつきがある。これらの特徴領域情報は、同じ領域であると判断しグルーピングすることで、大きさや形状がより正確な特徴領域情報を選択・算出しなければならない。
特徴領域情報保持手段7での、特徴領域情報のグルーピング方法について説明する。特徴領域情報保持手段7は、特徴領域情報保持手段7が抽出した特徴領域の中に同一の領域を示す位置情報があるかどうか判断し、同一の領域であるとみなされる特徴領域情報群をグルーピングする。特徴領域情報保持手段7で保持する特徴領域情報のうち、同じ領域を示す特徴領域情報であるか否かの判断は、具体的には各特徴領域情報の表す特徴領域の位置や大きさに関して、特徴領域間でオーバーラップする領域の面積が所定の割合(例えば大きい方の特徴領域の90%以上)よりも大きいといった基準を満たす場合に同じ特徴領域であるとみなす。
図7は、特徴領域情報保持手段7でグルーピングされた文字領域位置情報を、より正確な情報に更新する方法を示す図である。例えば、ワンセグ映像の場合、画像の左上端の座標を(0,0)、右下端の座標を(319,239)とすると、検出された文字領域の位置情報について、左上端の座標をa、右下端の座標をbとすれば、a(240,180)、b(300,215)などと表すことが出来る。したがって、特徴領域情報保持手段7に蓄積される特徴領域情報は、[a1,b1]、[a2,b2]、[a3,b3]、[a4,b4]、…のように、ばらつきを含んでいる。ここでのa1〜a4、b1〜b4の位置関係や出現回数は、図7に示す通りである。
特徴領域情報保持手段7はこのような履歴情報も合わせて保持し、蓄積された特徴領域情報の中から、(1)出現回数が最も多かった[a1,b1](2)左上端、右下端のそれぞれについて出現回数の多い[a1,b2](3)出現回数に差の少ない場合には、平均をとり[a1,(b1+b2)/2]とするなどの方法により、より正確な特徴領域情報を算出し、該当するグループの代表値とする。
このようにして、検出された複数の特徴領域情報をグルーピングすることができるが、このグルーピング処理では、特徴画像抽出手段100で抽出済の特徴領域の位置、大きさ、形状を用いているため、入力映像上の同じ領域に順次異なる文字情報が表示される場合などでは、同じ領域としてグルーピングされ、文字領域の画像内容の区別が付かなくなる。その結果、メモリ削減などで代表画像だけを残すような構成とする場合には、特定の画像(例えば、時間的に前のフレームで検出された画像)だけが保持されてしまう。
そこで、特徴画像抽出手段100から特徴領域の検出判定に使用したエッジ出現位置やエッジ強度、画素ブロックごとのエッジ数の分布状態といった検出判定情報を特徴領域情報保持手段7へ入力し、各特徴領域の検出判定情報もグルーピング処理に使用する。
例えば図8のように、時間的に連続して同じ領域に異なる文字情報が表示される場合、特徴領域情報の境界情報は同じになるため、検出判定情報を使用しないと先に述べたグルーピング動作により、特徴領域画像としては図8(a)で抽出した画像のみが保持されることになる。
そこで検出判定情報として画素ブロック毎のエッジ数の分布状態を使用すると、対応する各ブロックで保持する値の一致度や、同じ値の密集具合、密集部分の形状といった類似度の判定基準により、図8(a)と(b)では分布状態が異なると判定できる。
このようにして、比較する特徴領域情報間で位置、大きさに関する基準を満たして形状的には同一と判定され、かつ検出判定情報の類似度が所定の基準を満たせば真に同一の特徴領域を示すものとして、同じグループに登録する。また、形状的には同一と判定されたものの、検出判定情報の類似度が所定の基準を満たさなければ、異なる特徴領域であると判断し、異なるグループとして登録する。
このようにして特徴領域情報保持手段7でグルーピングされた特徴領域情報群から、使用者が画面上で指定した位置を含む特徴領域情報(指定特徴領域情報)があれば、処理対象領域決定手段8は、指定特徴領域情報に対応する特徴領域を処理対象領域とみなす。その結果、表示手段12で表示される特徴画像が使用者の意図するものと異なる場合は、さらに使用者からの指示による制御情報を受けることにより、検出判定情報によりさらに選別がなされた他の特徴領域情報を用いることができる。また、使用者が指定した位置を含む特徴領域情報がなければ、出現頻度の最も高い特徴領域情報を利用し、処理対象領域とするといった対応がとれる。その後の動作は実施の形態1と同様であるため、説明を省略する。
<効果>
実施の形態3に係る画像再生装置によれば、以下の効果を奏する。すなわち、実施の形態3の画像再生装置において、特徴画像抽出手段100は、特徴画像を検出する際に使用した特徴量(検出判定情報)を出力し、特徴領域情報保持手段7は、特徴量に基づいて特徴領域情報をグループ分けし、処理対象領域決定手段8は、指定位置情報とグループ分けされた特徴領域情報とに基づき、指定特徴領域情報を選択する。このように、特徴領域情報保持手段7で特徴領域情報をグルーピングするような構成としたので、特徴領域情報の位置、大きさ、形状などを正確に算出することができる。また検出判定情報を使って特徴領域情報を登録できるような構成としたので、より細かく特徴画像を分類することができ、使用者の要求により正確に応えることが可能となる。
又、特徴量は、特徴領域のエッジ出現位置、エッジ強度、所定の閾値よりも大きいエッジ強度を持つ画素数の画素ブロック毎の分布状態からなる。これにより、より細かく特徴画像を分類することができ、使用者の要求により正確に応えることが可能となる。
(実施の形態4)
<構成>
図9は、本発明の実施の形態4における画像再生装置の構成を示す概略ブロック図である。実施の形態4の画像再生措置は、図6に示した実施の形態3の画像再生装置と比較して、処理対象領域加工手段9を新たに設けている点が異なる。
<動作>
本実施の形態における処理対象領域加工手段9が関わる動作について説明する。
処理対象領域加工手段9は、領域画像取得手段13から特徴領域画像データを受け、制御手段10からの制御情報にしたがって画像処理を施す。出力処理手段11は、フレームメモリ2からフレームメモリ制御手段3を介して読み出したフレームデータと処理対象領域加工手段9で加工された領域画像データをオーバーレイ処理して、表示手段12に出力する。
処理対象領域加工手段9は、読み込んだ領域画像に対して見易さを改善するために拡大処理やコントラスト調整などの画像処理を行う。文字等の特徴画像の検出は、演算量の軽減などの目的から輝度(Y)信号のみで行う事が出来るが、処理対象領域の画像処理はRGB、若しくはYUVのカラー画像に対して行う。
本発明では、選択されたタイミングで、しかも比較的小領域の処理対象領域に対して画像処理を行うため、処理時間や処理負荷の点からマイコンなどによるソフトウェア処理が可能である。なお、処理対象領域加工手段9で加工した特徴領域画像データは、出力処理手段11に出力するものとしたが、一旦フレームメモリ2に格納した後に出力処理手段11がフレームメモリ2から取得しても良い。
すなわち、制御手段10は指定された表示動作の情報を出力し、画像再生装置は指定領域画像に対し表示動作の情報に基づいて画像加工処理を施す処理対象領域加工手段9を備える。これにより、使用者が見やすいように特徴画像を拡大して再生映像にオーバーレイ表示することが可能となる。
<画像表示>
次に、画像再生装置を実際に使用する際の、ユーザインタフェースについて説明する。
図10は、本実施の形態におけるユーザインタフェースの一例を示すものである。このユーザインタフェースは、簡単な操作によって使用者が所望する情報を見やすく表示し、且つ見逃した情報を任意のタイミングで確認できることによって使用者の利便性を向上させることを目的とする。
例えば、使用者が現在表示されている文字情報に1回タッチすると(図10(a))、当該文字情報は拡大する(図10(c))。又、当該画面上の箇所を長押し、あるいは2度押しすると(図10(b))、その領域に過去に表示された文字情報を遡り表示する(図10(d))。もちろん、この他にも縮小表示や表示位置の変更、最新履歴の表示だけでなく過去の履歴の遡り表示など様々な表示方法が適用できる。
1回タッチや長押しという使用者が表示手段12のタッチパネルで行った操作により、制御手段10から指定位置情報が処理対象領域決定手段8へ、制御情報が処理対象領域加工手段9に送られる。ここでの制御情報とは、使用者が1回タッチしたのか長押ししたのかを示す情報である。
指定位置情報にしたがって、処理対象領域決定手段8はどのフレームデータの特徴領域を使用するかを決定し、選ばれた特徴領域情報(指定特徴領域情報)を領域画像取得手段13に出力し、領域画像取得手段13では対応する領域画像をフレームメモリ2から読み出し、処理対象領域加工手段9へ出力する。処理対象領域加工手段9は制御情報に従って入力された領域画像に対して画像加工を行い、加工済の領域画像を出力処理手段11へ出力する。
また処理対象領域加工手段9で、オーバーレイする領域画像の周囲に額縁を付加することにより強調してもよい。この場合は、あらかじめ領域画像取得手段13で領域画像を取得する際に、処理対象領域決定手段8で決定された特徴領域情報よりも上下左右に額縁の太さに相当する数画素程度のマージンを取ることで、特徴画像を欠けさせることなく額縁を付加することができる。
出力処理手段11では、フレームメモリ2から表示すべきオリジナル画像のフレームデータを読み出し、当該フレームデータに対して加工済領域画像データをオーバーレイ処理し、表示手段12へ出力する。出力処理手段11は、オーバーレイされる領域画像とオリジナル画像との境界部分で発生する不連続部分に対して、境界部を平滑化することで不連続部分を滑らかにするなどの、視聴者が違和感なく視聴できるようなフィルタ処理を行うようにしてもよい。
2 フレームメモリ、4 特徴ブロック検出手段、5 誤検出除去手段、6 特徴領域整形手段、7 特徴領域情報保持手段、8 処理対象領域決定手段、9 処理対象領域加工手段、10 制御手段、11 出力処理手段、13 領域画像取得手段、100 特徴画像抽出手段。

Claims (10)

  1. 入力映像から所定の画像処理により特徴画像を抽出する特徴画像抽出手段と、
    前記特徴画像抽出手段が抽出した前記特徴画像の前記入力映像上の領域である特徴領域の情報を特徴領域情報として蓄積する特徴領域情報保持手段と、
    指定された表示画面上の表示座標系での位置を前記入力映像上の映像座標系の指定位置に変換して指定位置情報として出力する制御手段と、
    過去の前記特徴領域情報の中から前記指定位置を含む前記特徴領域に対応する前記特徴領域情報を指定特徴領域情報として選択する処理対象領域決定手段と、
    前記指定特徴領域情報の前記特徴領域の画像を指定領域画像として取得する領域画像取得手段と、
    前記指定領域画像を前記入力映像の再生映像にオーバーレイ処理する出力処理手段と、を備え
    前記特徴画像抽出手段は、前記入力映像から特徴ブロックを検出する特徴ブロック検出手段と、検出された前記特徴ブロックのフレーム方向の変化および検出された前記特徴ブロックの周辺画素の変化のうち少なくとも一方の変化に基づいて検出対象とする前記特徴ブロックか否かを判断する誤検出除去手段とを有し、検出対象とすると判断した前記特徴ブロックから前記特徴画像を抽出することを特徴とする、画像再生装置。
  2. 前記特徴領域情報は、特徴画像と前記特徴画像の境界を表す境界情報とを有し、
    前記処理対象領域決定手段は、前記境界情報によって指定位置を含むことを判断し、
    前記領域画像取得手段は、前記特徴領域情報の前記特徴画像を指定領域画像とすることを特徴とする、請求項1に記載の画像再生装置。
  3. 前記入力映像の各フレーム画像を識別子と共に記憶する記憶手段をさらに備え、
    前記特徴領域情報は、抽出元の前記フレーム画像の前記識別子を有し、
    前記領域画像取得手段は、前記指定特徴領域情報の識別子に対応する前記記憶手段に記憶されたフレーム画像のうち前記境界情報が示す部分を前記指定領域画像として取得することを特徴とする、請求項2に記載の画像再生装置。
  4. 前記誤検出除去手段は、前記フレーム画像の局所ヒストグラムをフレーム間で比較することにより、前記入力映像上に前記特徴画像が出現するタイミングと出現領域を検出し、前記出現領域以外で抽出される前記特徴画像を誤検出として除去することを特徴とする、請求項に記載の画像再生装置。
  5. 前記誤検出除去手段は、前記特徴領域として特定された領域のうち、エッジ強度の大きさが所定の基準を満たす画素あるいは画素ブロックが所定の方向に所定の閾値を超えて連続して並ぶ領域を誤検出として除去することを特徴とする、請求項1〜4のいずれかに記載の画像再生装置。
  6. 前記特徴画像抽出手段は、前記特徴画像を検出する際に使用した特徴量を出力し、
    前記特徴領域情報保持手段は、前記特徴量に基づいて前記特徴領域情報をグループ分けし、
    前記処理対象領域決定手段は、前記指定位置情報と前記グループ分けされた前記特徴領域情報とに基づき、前記指定特徴領域情報を選択することを特徴とする、請求項1〜5のいずれかに記載の画像再生装置。
  7. 前記特徴量は、前記特徴領域のエッジ出現位置、エッジ強度、所定の閾値よりも大きいエッジ強度を持つ画素数の画素ブロック毎の分布状態からなることを特徴とする、請求項6に記載の画像再生装置。
  8. 前記特徴領域情報保持手段は、前記特徴領域情報を出現回数と共に蓄積し、出現回数に応じて前記グループ分けしたグループ毎に前記特徴領域情報の代表値を算出し、
    前記処理対象領域決定手段は、過去の前記特徴領域情報の前記代表値の中から前記指定特徴領域情報を選択することを特徴とする、請求項6または7に記載の画像再生装置。
  9. 前記特徴領域情報保持手段は、前記特徴領域情報を出現回数と共に蓄積し、
    前記処理対象領域決定手段は、前記指定位置を含む前記特徴領域に対応する前記特徴領域情報を出現回数に応じて前記指定特徴領域情報として選択することを特徴とする、請求項1〜のいずれかに記載の画像再生装置。

  10. 前記制御手段は、指定された表示動作の情報を出力し、
    前記指定領域画像に対し前記表示動作の情報に基づいて画像加工処理を施す処理対象領域加工手段をさらに備えたことを特徴とする、請求項1〜7のいずれかに記載の画像再生装置。
JP2009148303A 2009-06-23 2009-06-23 画像再生装置 Expired - Fee Related JP5424737B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009148303A JP5424737B2 (ja) 2009-06-23 2009-06-23 画像再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009148303A JP5424737B2 (ja) 2009-06-23 2009-06-23 画像再生装置

Publications (3)

Publication Number Publication Date
JP2011009816A JP2011009816A (ja) 2011-01-13
JP2011009816A5 JP2011009816A5 (ja) 2012-07-26
JP5424737B2 true JP5424737B2 (ja) 2014-02-26

Family

ID=43566007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009148303A Expired - Fee Related JP5424737B2 (ja) 2009-06-23 2009-06-23 画像再生装置

Country Status (1)

Country Link
JP (1) JP5424737B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8446432B2 (en) * 2011-07-12 2013-05-21 Sony Corporation Context aware user interface system
US11594028B2 (en) * 2018-05-18 2023-02-28 Stats Llc Video processing for enabling sports highlights generation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0918802A (ja) * 1995-06-27 1997-01-17 Sharp Corp 映像信号処理装置
JPH0991453A (ja) * 1995-09-21 1997-04-04 Sanyo Electric Co Ltd 画像処理方法およびその装置
JP3609236B2 (ja) * 1997-05-16 2005-01-12 日本電信電話株式会社 映像テロップ検出方法および装置
JP4507639B2 (ja) * 2004-03-01 2010-07-21 ソニー株式会社 画像信号処理装置
JP2006211207A (ja) * 2005-01-27 2006-08-10 Sharp Corp 画面拡大装置
JP4637180B2 (ja) * 2005-07-27 2011-02-23 パイオニア株式会社 映像処理装置及び映像処理方法
JP2008199464A (ja) * 2007-02-15 2008-08-28 Toshiba Corp テロップ再生装置、プログラムおよびテロップ再生方法
JP2009065432A (ja) * 2007-09-06 2009-03-26 Mitsubishi Electric Corp 画像再生装置
JP4613941B2 (ja) * 2007-10-10 2011-01-19 三菱電機株式会社 文字表示領域検出装置及びその方法、並びに携帯端末

Also Published As

Publication number Publication date
JP2011009816A (ja) 2011-01-13

Similar Documents

Publication Publication Date Title
CN101841643B (zh) 一种黑边检测方法和装置
US8355079B2 (en) Temporally consistent caption detection on videos using a 3D spatiotemporal method
US20110145883A1 (en) Television receiver and method
JP2008520152A (ja) 画像中のテキストの検出および修正
JP2013176102A (ja) 受信器で視聴覚的記録を見る方法及びそのような記録を見るための受信器
JP2004364234A5 (ja)
JPH08212231A (ja) 字幕検出方法および動画像の代表画像抽出装置
EP2141658B1 (en) Method for detecting layout areas in a video image and method for generating a reduced size image using the detection method
JP2003198975A (ja) 映像表示装置
JP2014077993A (ja) 表示装置
JP2009130899A (ja) 画像再生装置
JP5424737B2 (ja) 画像再生装置
US20070018999A1 (en) Auto-centering of main image
JP7268848B2 (ja) コマーシャル検出装置
JP5408097B2 (ja) 画像表示装置、画像表示方法
JP4613941B2 (ja) 文字表示領域検出装置及びその方法、並びに携帯端末
EP1484763A1 (en) Music program contents menu creation apparatus and method
JP4288909B2 (ja) 文字情報検出装置及び文字情報検出方法、並びにプログラム及び記録媒体
JP3435334B2 (ja) 映像中文字領域抽出装置および方法および記録媒体
JP2009065432A (ja) 画像再生装置
JP4796767B2 (ja) 携帯端末および動画再生方法
JP2010009305A (ja) 画像処理装置、画像処理方法及びプログラム
JP2011009816A5 (ja)
CN114079815B (zh) 字幕保护方法、系统、终端设备及存储介质
CN112118439B (zh) 视频品质检测方法与影像处理电路

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120613

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131126

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees