JP2011033982A - 文字情報検出方法及び文字情報検出装置 - Google Patents
文字情報検出方法及び文字情報検出装置 Download PDFInfo
- Publication number
- JP2011033982A JP2011033982A JP2009182473A JP2009182473A JP2011033982A JP 2011033982 A JP2011033982 A JP 2011033982A JP 2009182473 A JP2009182473 A JP 2009182473A JP 2009182473 A JP2009182473 A JP 2009182473A JP 2011033982 A JP2011033982 A JP 2011033982A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- character
- value
- luminance
- character information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Controls And Circuits For Display Device (AREA)
- Television Signal Processing For Recording (AREA)
- Transforming Electric Information Into Light Information (AREA)
Abstract
【課題】ビデオ画像中に挿入されている字幕を挿入形式にかかわらず画像中から精度よく検出することができる技術を提供する。
【解決手段】映像信号入力部71で入力された映像信号について、開始位置検出部73によって注目画素の輝度値及びその周辺画素間の輝度差分値の大きさ、及び色差の絶対値に基づいて文字開始画素を検出する。同様に、終了位置検出部74は文字終了画素を検出する。そして、文字情報検出部75は、映像信号内の文字開始画素と文字終了画素の間の画素群の長さが映像信号内において相対的に短い場合にその画素群を文字情報として検出する。
【選択図】図7
【解決手段】映像信号入力部71で入力された映像信号について、開始位置検出部73によって注目画素の輝度値及びその周辺画素間の輝度差分値の大きさ、及び色差の絶対値に基づいて文字開始画素を検出する。同様に、終了位置検出部74は文字終了画素を検出する。そして、文字情報検出部75は、映像信号内の文字開始画素と文字終了画素の間の画素群の長さが映像信号内において相対的に短い場合にその画素群を文字情報として検出する。
【選択図】図7
Description
本発明は、映像信号中の文字情報を検出する技術に関する。
一般的に映画やドラマ等のビデオソフトには、翻訳された台詞、内容や状況等の説明のために字幕が挿入されていることが多い。このような字幕付きの映像をプロジェクタ等を使用して鑑賞する場合、暗い部屋で映画を観賞すると字幕が眩しく、快適な観賞の邪魔になることがある。これを改善するためには、映像信号に含まれる字幕を検出して、字幕の明るさを制御することが考えられる。
これまでにも字幕の表示エリアを検出して字幕の輝度レベルを制御する技術として、特開平4−354480号公報(特許文献1)に開示される技術があった。特許文献1には、映像信号のレベルが連続的に黒レベルとなったときに字幕表示エリアであると検出し、字幕表示エリアの字幕信号のレベルを制限する技術が開示されている。
図1は、映像信号に含まれる字幕を検出して字幕の明るさを制御する従来の輝度制御回路の一例を示すブロック図である。
図1は、映像信号に含まれる字幕を検出して字幕の明るさを制御する従来の輝度制御回路の一例を示すブロック図である。
図1おいて、入力端子1は再生装置から供給される再生映像信号が入力される端子である。図1に示される輝度制御回路では、入力端子1を介して映像信号が後述するリミッタ10及び黒レベル検出回路2にそれぞれ供給される。黒レベル検出回路2は、入力端子1から入力された映像信号の黒レベルを電圧検出等により検出し、検出信号を出力する。黒レベル検出回路2は、例えば、入力映像信号が黒レベルと認められる時には映像信号を検出信号として出力し、これ以外のときにはローレベルの信号を検出信号として出力する。黒レベル検出回路2から出力された検出信号は、A/Dコンバータ3に供給される。
次いで、CPU4は、A/Dコンバータ3から出力されたディジタル信号を用いて黒レベルとなっている水平同期期間の連続性を検出し、字幕表示領域に相当する映像信号が続いている間、制御回路9に制御信号を供給する。制御回路9は、CPU4からの制御信号を受けてレベル制御信号を発生する。リミッタ10は、制御回路9から供給されたレベル制御信号に基づいて映像信号の字幕表示領域に相当する映像信号のレベルに対してレベルの制限を行う。これにより、図1に示される従来の輝度制御回路は、映像の映像部分の輝度はそのままに維持しつつ、字幕表示領域内の字幕部分の輝度を変更して所望の明るさで映出することを可能としている。
また、画像信号から字幕部分の画像信号を抽出して、画像の平均輝度が低下した場合にそれに伴って字幕部分の輝度が低下するように画像処理を施す画像表示装置もある(特許文献2)。
また、画像信号から字幕部分の画像信号を抽出して、画像の平均輝度が低下した場合にそれに伴って字幕部分の輝度が低下するように画像処理を施す画像表示装置もある(特許文献2)。
しかしながら、上記特許文献1に記載の技術は、画面の上下に黒い部分を表示し、その黒い部分に字幕スーパーを映し出すシネマスコープサイズの形態で記録された映像信号にしか使えないという問題があった。したがって、市場に流通している映画やドラマ等のビデオソフトに挿入されている字幕はシネマスコープサイズの形態で記録されたものだけに限られないため、上記特許文献1に記載の技術をすべての字幕付きの映像に適用することはできなかった。
また、上記特許文献2に記載の技術は、字幕の背景となる画像の明るさから字幕の明るさを調整する必要があるため、1フレーム或いは複数フレーム等の画像信号を記憶することができるある程度大きなメモリが必要となる。
また、上記特許文献2に記載の技術は、字幕の背景となる画像の明るさから字幕の明るさを調整する必要があるため、1フレーム或いは複数フレーム等の画像信号を記憶することができるある程度大きなメモリが必要となる。
本発明は、上述した事情に鑑みてなされたものであり、上述のような問題を解決することを課題の一例とするものであり、これらの課題を解決することができる文字情報検出方法及び文字情報検出装置を提供することを目的とする。
上記課題を解決するために、請求項1に記載の発明は、映像信号に含まれる文字情報を検出する文字情報検出方法であって、前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の絶対値を該映像信号内の他画素の値と比較して前記画素が文字開始画素かどうかを判定することにより文字開始画素を検出する第1の工程と、前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の絶対値を該映像信号内の他画素の値と比較して前記画素が文字終了画素かどうかを判定することにより文字終了画素を検出する第2の工程と、前記映像信号内の前記文字開始画素から前記文字終了画素までの間の画素群の長さで該画素群が文字情報かどうかを判定することにより文字情報を検出する第3の工程とを有することを特徴とする。
また、上記課題を解決するために、請求項2に係る発明は、映像信号に含まれる文字情報を検出する文字情報検出方法であって、前記映像信号内の画素の周辺画素間の輝度差分値を検出する第1の工程と、前記輝度差分値が第1閾値以上、かつ前記画素の輝度値が第2閾値以上、かつ前記画素の色差の絶対値が第3閾値以下のときに、該画素を文字開始画素とする第2の工程と、前記輝度差分値が第4閾値以下、かつ前記画素の輝度値が第5閾値以下、かつ前記画素の色差の絶対値が前記第3閾値以下のときに、該画素を文字終了画素とする第3の工程と、前記映像信号内の前記文字開始画素から前記文字終了画素までの間の長さが第6閾値よりも小さいときに、該画素群を文字情報として検出する第4の工程とを有することを特徴とする。
さらに、上記課題を解決するために、請求項6に係る発明は、映像信号に含まれる文字情報を検出する文字情報検出方法であって、前記映像信号内の一列に配列された画素列中の注目画素Pn(nは1以上の整数)に隣接する画素Pn+1の輝度値と該注目画素Pnのもう一方に隣接する画素Pn−1の輝度値の差分Pn+1−Pn−1、又は前記注目画素Pnの輝度値と該注目画素Pnの隣接画素Pn−1の輝度値の差分Pn−Pn−1を前記注目画素Pnにおける第1差分値として検出し、前記注目画素Pnにおける第1差分値と該注目画素Pnの少なくとも1つ以上の周辺画素Pn−1,Pn−2,…における第1差分値との和を第2差分値として検出する第1工程と、前記第1差分値が第1閾値以上、かつ前記注目画素Pnの輝度値が第2閾値以上、かつ前記注目画素Pnの色差の絶対値が第3閾値以下のときに、前記注目画素Pnを第1文字開始画素候補とし、前記第2差分値が前記第1閾値以上、かつ前記注目画素Pnの輝度値が前記第2閾値以上、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字開始画素候補とする第2工程と、前記第1差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第1文字終了画素候補とし、前記第2差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が前記第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字終了画素候補とする第3工程と、前記第1文字開始画素候補から前記第1文字終了画素候補までの間の画素群の長さが第6閾値よりも小さいときに、前記第1文字開始画素候補を文字開始画素とし、前記第1文字終了画素候補を文字終了画素として前記画素群を文字情報として検出する第3工程と、前記第1文字開始位置候補から前記第1文字終了位置候補までの間の長さが前記第6閾値以上であって、前記第2文字開始位置候補から前記第2文字終了位置候補までの間の距離が前記第6閾値よりも小さいときに、前記第2文字開始位置候補を文字開始位置とし、前記第2文字終了位置候補を文字終了位置として前記画素群を文字情報として検出する第4工程とを有することを特徴とする。
さらにまた、上記課題を解決するために、請求項7に係る発明は、映像信号に含まれる文字情報を検出する文字情報検出装置であって、前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の大きさを該映像信号内の他画素の値と比較して前記画素が文字開始画素かどうかを判定することにより文字開始画素を検出する開始位置検出手段と、前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の大きさを該映像信号内の他画素の値と比較して前記画素が文字終了画素かどうかを判定することにより文字終了画素を検出する終了位置検出手段と、前記映像信号内の前記文字開始画素から前記文字終了画素までの間の画素群の長さで該画素群が文字情報かどうかを判定することにより文字情報を検出する文字情報検出手段とを備えることを特徴とする。
さらにまた、上記課題を解決するために、請求項8に係る発明は、映像信号に含まれる文字情報を検出する文字情報検出装置であって、前記映像信号内の画素の周辺画素間の輝度差分値を検出する差分値検出手段と、前記輝度差分値が第1閾値以上、かつ前記画素の輝度値が第2閾値以上、かつ前記画素の色差の絶対値が第3閾値以下のときに、該画素を文字開始画素とする開始位置検出手段と、前記輝度差分値が第4閾値以下、かつ前記画素の輝度値が第5閾値以下、かつ前記画素の色差の絶対値が前記第3閾値以下のときに、該画素を文字終了画素とする終了位置検出手段と、前記映像信号内の前記文字開始画素から前記文字終了画素までの間の長さが第6閾値よりも小さいときに、該文字開始画素と該文字終了画素との間の画素群を文字情報として検出する文字情報検出手段とを備えることを特徴とする。
さらにまた、上記課題を解決するために、請求項12に記載の発明は、映像信号に含まれる文字情報を検出する文字情報検出装置であって、前記映像信号内の一列に配列された画素列中の注目画素Pn(nは1以上の整数)に隣接する画素Pn+1の輝度値と該注目画素Pnのもう一方に隣接する画素Pn−1の輝度値の差分Pn+1−Pn−1、又は前記注目画素Pnの輝度値と該注目画素Pnの隣接画素Pn−1の輝度値の差分Pn−Pn−1を前記注目画素Pnにおける第1差分値として検出し、前記注目画素Pnにおける第1差分値と該注目画素Pnの少なくとも1つ以上の周辺画素Pn−1,Pn−2,…における第1差分値との和を第2差分値として検出する差分値検出手段と、前記第1差分値が第1閾値以上、かつ前記注目画素の輝度値が第2閾値以上、かつ前記注目画素の色差の絶対値が第3閾値以下のときに、前記注目画素Pnを第1文字開始画素候補とし、前記第2差分値が前記第1閾値以上、かつ前記注目画素Pnの輝度値が前記第2閾値以上、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字開始画素候補とする開始位置検出手段と、前記第1差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第1文字終了画素候補とし、前記第2差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が前記第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字終了画素候補とする終了位置検出手段と、前記第1文字開始画素候補から前記第1文字終了画素候補までの間の長さが第6閾値よりも小さいときに、前記第1文字開始画素候補を文字開始画素とし、前記第1文字終了画素候補を文字終了画素として前記画素群を文字情報として検出するとともに、前記第1文字開始位置候補から前記第1文字終了位置候補までの間の長さが前記第6閾値以上であって、前記第2文字開始位置と前記第2文字終了位置との間隔が前記第6閾値よりも小さいときに、前記第2文字開始位置候補を文字開始位置とし、前記第2文字終了位置候補を文字終了位置として前記画素群を文字情報として検出する文字情報検出手段とを備えることを特徴とする。
さらにまた、上記課題を解決するために、請求項13に記載の映像信号処理装置の発明は、映像信号に含まれる文字情報を検出して文字情報検出信号を出力する請求項7から12までのいずれか1項に記載の文字情報検出装置と、前記映像信号を所定期間蓄積する記憶装置と、前記文字情報検出信号に基づいて前記映像信号に含まれる文字情報の輝度を調整する輝度調整手段とを備えることを特徴とする。
さらにまた、上記課題を解決するために、請求項14に記載の発明は、請求項1から6までのいずれか1項に記載の文字情報検出方法をコンピュータに実行させるためのプログラムである。
さらにまた、上記課題を解決するために、請求項15に記載の発明は、請求項14に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体である。
以下、図面を参照して、本発明の一実施形態に係る文字情報検出方法及び文字情報検出装置について説明する。
図2は、本発明の一実施形態に係る映像信号の水平方向の一ラインの画素データの配列の様子を示す図である。図2においてP0,…,Pmaxは1つの画素を表し、各画素P0,…,Pmaxはそれぞれ輝度成分Y及び色差成分Cb、Crを持っている。本実施形態で対象とする字幕が挿入された映画等の画面は、図2に示されるような一列の画素群の映像信号が垂直方向に配列されることで構成される。
映画ソフト等の字幕は、一般的に、文字の周りを黒色で縁取られた高輝度の白色の文字であることが多い。このような字幕の場合は、映像信号中の当該字幕部分に相当する画素は高輝度の白色画素(白画素)であり、縁取り部分の画素は低輝度の黒色画素(黒画素)である。
本発明はこの特徴を利用することで、水平ライン方向の画素列で黒画素→白画素、白画素→黒画素となっている箇所を検出し,黒画素→白画素となっている画素から白画素→黒画素となっている画素までの間の画素群(白画素群)が字幕に相当する画素であると判定する。
一般に、映像信号中の各画素の色差成分Cb、Crは当該画素が白画素又は黒画素の場合、その値は0付近になる。ここで、色差成分のような正負の値をとる成分は、一般にオフセット・バイナリで表現されることが多い。オフセット・バイナリは、ストレート・バイナリを0が中央に来るように全体を押し下げたもので、最上位ビットMSB(Most Significant Bit)が1のときが正、0のときが負になっている。すなわち、MSBがサインビットとなっている。例えば、8ビットのオフセット・バイナリで0付近の値は、10進法表現で128付近の値に相当する。そこで本実施形態では、映像信号が各画素8ビットで表現されており、色差成分Cb、Crが128付近であるか否かによって、当該画素が白画素又は黒画素であるか否かを判断する。尚、本実施形態では映像信号を各画素8ビットで表現しているが、この設定は本発明の一実施形態を説明するための一例であって、映像信号を8ビット以上又は8ビット以下の画素で表現した場合であっても同様の処理が可能である。
尚、以下の実施形態では、一例として、映像信号中の字幕を高輝度の白色の文字とした場合の文字検出方法及び装置について説明するが、本発明の適用は高輝度の白色の字幕だけに限定されるわけではない。すなわち、高輝度の白色以外の字幕であっても、その文字部分の画素の色差は映像信号中では一定の値をとることから、文字画素の色差成分の判定の際に文字色の値にあわせた演算(この場合は色差成分が白や黒を示す0付近ではない値での演算となる。)をさせることにより、白色以外の字幕に対しても本発明の適用が可能となる。そして、このような処理を行うためには、例えば、本発明を実施するための文字情報検出装置に字幕の色に合わせた色差(固定値又は一定範囲の値)を与えることができる構成を付加すればよい。また、映像信号中の字幕の色がわかった時点でユーザがその色を選択できるような構成を当該装置に付与してもよい。
<第1の実施形態>
以下の実施形態では、DVDプレーヤ、ブルーレイディスクプレーヤ及びディスプレイ装置等の内部装置、或いはそれらに接続可能な外部装置として構成される文字情報検出装置における文字情報検出処理について説明する。尚、本実施形態に係る文字情報検出処理おいては、一例として、一画面が縦Lmax+1画素×横Pmax+1画素で構成された映画等の動画像の映像信号から字幕を検出するものとする。
図3は、本発明の第1の実施形態に係る文字情報検出方法の手順を説明するためのフローチャートである。
以下の実施形態では、DVDプレーヤ、ブルーレイディスクプレーヤ及びディスプレイ装置等の内部装置、或いはそれらに接続可能な外部装置として構成される文字情報検出装置における文字情報検出処理について説明する。尚、本実施形態に係る文字情報検出処理おいては、一例として、一画面が縦Lmax+1画素×横Pmax+1画素で構成された映画等の動画像の映像信号から字幕を検出するものとする。
図3は、本発明の第1の実施形態に係る文字情報検出方法の手順を説明するためのフローチャートである。
(処理1)
まず、文字情報検出装置内のパラメータm、nを0とする(ステップS101)。当該パラメータm、nは文字情報検出処理を行っている映像信号中の注目画素の位置を示すものであり、0以上の整数である。従って、以下の処理では、水平ラインLm(m=0,…,max)毎に処理が行われていく。
まず、文字情報検出装置内のパラメータm、nを0とする(ステップS101)。当該パラメータm、nは文字情報検出処理を行っている映像信号中の注目画素の位置を示すものであり、0以上の整数である。従って、以下の処理では、水平ラインLm(m=0,…,max)毎に処理が行われていく。
そこで、図2に示す水平ラインLmの画素P1から順に前後の画素間の輝度差分値である一次微分値を求める(ステップS102)。すなわち、注目画素Pnとその隣接画素Pn+1,Pn−1が有する輝度成分をそれぞれYn,Yn+1,Yn−1とすると、注目画素(処理対象画素)の輝度差分値dnは隣接画素間の差分値(Yn−Yn−1)又は一次微分値(Yn+1−Yn−1)等で計算することができる。本実施形態では、これらのどの輝度差分値を用いてもよい。
(処理2)
当該処理では、字幕の開始位置を特定するために、映像信号が黒→白へ変化している部分の検出を行う。本実施形態では、以下の条件をすべて満たす画素を文字開始画素候補として検出する(ステップS103)。
・条件1:処理1で得られた輝度差分値dnが正であり、かつ当該輝度差分値が第1閾値A以上であること…dn≧A>0(第1閾値Aは、注目画素が文字開始画素候補であるか否かを、注目画素と隣接画素の輝度が一定以上の差異があることで当該注目画素が文字のエッジを構成する画素になっているか否かで判定するために用いられる。)
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B(第2閾値は、注目画素が文字開始画素候補であるか否かを、注目画素が高輝度の画素であるか否かで判定するために用いられる。)
・条件3:注目画素Pnの色差成分Cb,Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること(第3閾値Iは、注目画素が白画素の文字開始画素候補であるか否かを、注目画素の色差が0に近いことによって判定するために用いられる。)
当該処理では、字幕の開始位置を特定するために、映像信号が黒→白へ変化している部分の検出を行う。本実施形態では、以下の条件をすべて満たす画素を文字開始画素候補として検出する(ステップS103)。
・条件1:処理1で得られた輝度差分値dnが正であり、かつ当該輝度差分値が第1閾値A以上であること…dn≧A>0(第1閾値Aは、注目画素が文字開始画素候補であるか否かを、注目画素と隣接画素の輝度が一定以上の差異があることで当該注目画素が文字のエッジを構成する画素になっているか否かで判定するために用いられる。)
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B(第2閾値は、注目画素が文字開始画素候補であるか否かを、注目画素が高輝度の画素であるか否かで判定するために用いられる。)
・条件3:注目画素Pnの色差成分Cb,Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること(第3閾値Iは、注目画素が白画素の文字開始画素候補であるか否かを、注目画素の色差が0に近いことによって判定するために用いられる。)
ステップS103で上記条件1〜3を全て満たす場合(Yes)、注目画素Pnを字幕開始画素候補として記録し(水平ライン中の画素の位置を示すパラメータedgeにnを割り当てる)、開始検出信号Start(n)を1にする(ステップS104)。一方、ステップS103でそれ以外の場合(No)、開始検出信号Start(n)を0にする(ステップS105)。
尚、前述したように本実施形態では色差成分Cb、Crがオフセット・バイナリ表現であるため、ステップS103の処理における色差成分Cb、Crが0付近であることの検出は、色差成分Cb、Crと一定値Hb、Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求め、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。
(処理3)
当該処理では、字幕の終了位置を特定するために、映像信号が白→黒へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字終了画素候補として検出する(ステップS106)。
・条件1:処理1で得られた輝度差分値が負であること…dn<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|dn|≧C(第4閾値Dは、注目画素が文字終了画素候補であるか否かを、注目画素と隣接画素の輝度が一定以上の差異があることで当該注目画素が文字画素とエッジを構成する画素になっているか否かで判定するために用いられる。)
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D(第5閾値は、注目画素が白画素から黒画素に切り替わった部分である文字終了画素候補であるか否かを、注目画素が低輝度の画素であるか否かで判定するために用いられる。)
・条件4:注目画素Pnの色差成分Cb、Crが0付近であること
当該処理では、字幕の終了位置を特定するために、映像信号が白→黒へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字終了画素候補として検出する(ステップS106)。
・条件1:処理1で得られた輝度差分値が負であること…dn<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|dn|≧C(第4閾値Dは、注目画素が文字終了画素候補であるか否かを、注目画素と隣接画素の輝度が一定以上の差異があることで当該注目画素が文字画素とエッジを構成する画素になっているか否かで判定するために用いられる。)
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D(第5閾値は、注目画素が白画素から黒画素に切り替わった部分である文字終了画素候補であるか否かを、注目画素が低輝度の画素であるか否かで判定するために用いられる。)
・条件4:注目画素Pnの色差成分Cb、Crが0付近であること
ステップS106で上記条件1〜4を全て満たす場合(Yes)、注目画素Pnを字幕終了画素候補として終了検出信号End(n)を1にする(ステップS107)。一方、ステップS106でそれ以外の場合(No)、終了検出信号End(n)を0にする(ステップS108)。
尚、処理3においても色差成分Cb、Crが0付近であることの検出は、Cb、Crがオフセット・バイナリ表現であるため、色差成分Cb、Crと一定値Hb、Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求めて、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。すなわち、第3閾値Iは、注目画素が黒画素の文字終了画素候補であるか否かを、注目画素の色差が0に近いことによって判定するために用いられる。
次いで、白から黒への変化を検出した時、すなわち字幕終了画素候補が検出された時の水平位置と文字開始画素候補の水平位置との差の確認を行う(ステップS109)。本実施形態では、文字開始画素候補と文字終了画素候補の画像上の距離(n−edge)が第6閾値Eよりも小さいか否かを判断する。すなわち、本実施形態では字幕を構成する文字の線の幅をE画素程度とした。そして、以下に示すように、開始検出信号が1になってからE画素間のうちに終了検出信号が1にならない場合は、そのときの開始検出信号を0にし、次の開始検出信号を探すようにしている。
ステップS109の判断の結果、当該距離がE画素以上である場合(No)、文字開始画素候補及び文字終了画素候補はそれぞれ文字開始画素及び文字終了画素ではないとして、この時の開始検出信号Start(n)及び終了検出信号End(n)を無効とし、それぞれに0を割り当てる(ステップS111)。
一方、文字開始画素候補と文字終了画素候補間の画素数(n−edge)が第6閾値Eより小さい場合(ステップS109でYesの場合)、文字開始画素候補及び文字終了画素候補をそれぞれ文字開始画素及び文字終了画素とする。すなわち、開始検出信号Start(edge)及び終了検出信号End(n)の値に1を割り当てる(ステップS110)。そして、開始検出信号が1になってから終了検出信号が1になっているまでの間の信号(画素)を文字(字幕)の一部として、この区間のenable信号を1とする(ステップS112)。そして、水平位置を示すパラメータnに1をインクリメントし(ステップS113)、ステップS114に進む。
(処理4)
ステップS114では、上記処理2及び処理3に示した各ステップの処理を一水平ライン分行ったか否かを判断する。すなわち、ステップS114でn<Pmaxと判断される場合(Yes)は、まだ一ライン分の処理を行ってないとしてステップS102に戻って上記処理を繰り返す。一方、ステップS114でn≧Pmaxと判断される場合(No)は、上記処理を一ライン分行ったとしてステップS115に進む。ステップS115では、映像信号内の各ラインの処理で検出されたenable信号が1になっている画素群を字幕を構成する画素として検出する。このように本実施形態では、各ライン単位で文字情報検出処理を行うので文字検出装置にフレームメモリを持たせる必要がなく、ラインメモリを持たせるだけでよい。ステップS115の文字検出処理の後、次のラインに進むために垂直ラインの位置を示すパラメータmに1をインクリメントする(ステップS116)。そして、全ラインについて上記処理2及び処理3の各ステップの処理が終了したか否かを判断する(ステップS117)。
ステップS114では、上記処理2及び処理3に示した各ステップの処理を一水平ライン分行ったか否かを判断する。すなわち、ステップS114でn<Pmaxと判断される場合(Yes)は、まだ一ライン分の処理を行ってないとしてステップS102に戻って上記処理を繰り返す。一方、ステップS114でn≧Pmaxと判断される場合(No)は、上記処理を一ライン分行ったとしてステップS115に進む。ステップS115では、映像信号内の各ラインの処理で検出されたenable信号が1になっている画素群を字幕を構成する画素として検出する。このように本実施形態では、各ライン単位で文字情報検出処理を行うので文字検出装置にフレームメモリを持たせる必要がなく、ラインメモリを持たせるだけでよい。ステップS115の文字検出処理の後、次のラインに進むために垂直ラインの位置を示すパラメータmに1をインクリメントする(ステップS116)。そして、全ラインについて上記処理2及び処理3の各ステップの処理が終了したか否かを判断する(ステップS117)。
その結果、ステップS117でパラメータmの値がQmax以下と判断された場合(Yes)は、ステップS102に戻って上記処理を繰り返す。一方、ステップS117で全ラインについての処理が終了したと判断された場合(No)は、本処理を終了する。
尚、上述の処理で用いる各閾値A,B,C,D,E,Iには、経験値(固定値)或いは対象となる映像信号の種類(素材、チャンネル等)に応じた可変値を用いることができる。したがって、上記処理を行う装置に、経験値である固定の閾値を保持する構成、或いは、各閾値A,B,C,D,E,Iのそれぞれに複数の値をとることができるような構成を保持させておいて映像信号の種類に応じて閾値を選択する構成、或いは映像信号として入力される画像の平均輝度値等から閾値を計算して決定するような構成等を付加するようにしてもよい。
上述したように、本実施形態に係る文字情報検出方法によれば、ビデオ画像中に挿入されている字幕を挿入形式にかかわらず画像中から精度よく検出することができる。すなわち、字幕がシネマスコープサイズの形態で記録されているかいないかには全く関係なく字幕を精度よく検出することができる。
<第2の実施形態>
次に、各画面が縦Lmax+1画素×横Pmax+1画素で構成された映画等の動画像の映像信号と同じものから字幕を検出する文字情報検出処理の別の実施形態について説明する。
次に、各画面が縦Lmax+1画素×横Pmax+1画素で構成された映画等の動画像の映像信号と同じものから字幕を検出する文字情報検出処理の別の実施形態について説明する。
図4は、本発明の第2の実施形態に係る文字情報検出方法の手順を説明するためのフローチャートである。第2の実施形態は前述した第1の実施形態とほぼ同様の処理を行っているが、本実施形態では字幕構成画素の判定精度を向上させるために、1つの注目画素Pnに対して2つの輝度差分値d1,n,d2,nを用いて文字情報検出処理を行っている。
まず、文字情報検出装置内のパラメータm、nを0とするとともに文字情報検出処理に使用する輝度差分値の数を示すパラメータxに1を割り当てる(ステップS201)。尚、本実施形態では2つの輝度差分値を用いるので、パラメータxは1又は2が割り当てられることになる。その後、水平ラインLm(m=0,…,max)毎に上記第1の実施形態で説明した処理2及び処理3と同様の処理を第1の輝度差分値d1,nについて行う(ステップS202〜S212)。
具体的には、まず、図2に示す水平ラインLmの画素P1から順に前後の画素間の第1の輝度差分値である一次微分値を求める(ステップS202)。すなわち、注目画素Pnとその隣接画素である画素Pn+1,Pn−1が有する輝度成分をそれぞれYn,Yn+1,Yn−1とすると、注目画素の輝度差分値d1,nは隣接画素間の差分値(Yn−Yn−1)又は一次微分値(Yn+1−Yn−1)等で計算することができる。本実施形態では、これらのどの輝度差分値を用いてもよい。
次いで、字幕の開始位置を特定するために、映像信号が黒→白へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字開始画素候補として検出する(ステップS203)。
・条件1:処理1で得られた第1の輝度差分値が正であり、かつ当該輝度差分値が第1閾値A以上であること…d1,n≧A>0
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B
・条件3:注目画素Pnの色差成分Cb、Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること
・条件1:処理1で得られた第1の輝度差分値が正であり、かつ当該輝度差分値が第1閾値A以上であること…d1,n≧A>0
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B
・条件3:注目画素Pnの色差成分Cb、Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること
ステップS203で上記条件1〜3を全て満たす場合(Yes)、注目画素Pnを字幕開始画素候補として記録し(水平ライン中の画素の位置を示すパラメータedge1にnを割り当てる)、開始検出信号Start(n)を1にする(ステップS204)。一方、ステップS203でそれ以外の場合(No)、開始検出信号Start(n)を0にする(ステップS205)。
尚、前述したように本実施形態では色差成分Cb,Crがオフセット・バイナリ表現であるため、ステップS203の処理における色差成分Cb,Crが0付近であることの検出は、色差成分Cb,Crと一定値Hb,Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求め、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。
次いで、字幕の終了位置を特定するために、映像信号が白→黒へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字終了画素候補として検出する(ステップS206)。
・条件1:上記処理1で得られた第1の輝度差分値が負であること…d1,n<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|d1,n|≧C
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D
・条件4:注目画素Pnの色差成分Cb,Crが0付近であること
・条件1:上記処理1で得られた第1の輝度差分値が負であること…d1,n<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|d1,n|≧C
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D
・条件4:注目画素Pnの色差成分Cb,Crが0付近であること
ステップS206で上記条件1〜4を全て満たす場合(Yes)、注目画素Pnを字幕終了画素候補として終了検出信号End(n)を1にする(ステップS207)。一方、ステップS206でそれ以外の場合(No)、終了検出信号End(n)を0にする(ステップS208)。
尚、上記処理においても色差成分Cb,Crが0付近であることの検出は、Cb、Crがオフセット・バイナリ表現であるため、色差成分Cb,Crと一定値Hb,Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求めて、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。
次いで、白から黒への変化を検出した時、すなわち字幕終了画素候補が検出された時の水平位置と文字開始画素候補の水平位置との差の確認を行う。本実施形態では、文字開始画素候補と文字終了画素候補の画像上の距離(n−edge1)が第6閾値Eよりも小さいか否かを判断する(ステップS209)。すなわち、本実施形態では字幕を構成する文字の線の幅をE画素程度とした。そして、以下に示すように、開始検出信号が1になってからE画素間のうちに終了検出信号が1にならない場合は、そのときの開始検出信号を0にし、次の開始検出信号を探すようにしている。
ステップS209の判断の結果、当該距離がE画素以上である場合(No)、文字開始画素候補及び文字終了画素候補はそれぞれ文字開始画素及び文字終了画素ではないとして、この時の開始検出信号Start(edge1)及び終了検出信号End(n)を無効とし、それぞれに0を割り当てる(ステップS211)。
一方、文字開始画素候補と文字終了画素候補間の画素数(n−edge1)が第6閾値Eよりも小さい場合(ステップS109でYesの場合)、文字開始画素候補及び文字終了画素候補をそれぞれ第1文字開始画素及び第1文字終了画素とする。すなわち、開始検出信号Start(edge1)及び終了検出信号End(n)の値に1を割り当てる(ステップS210)。そして、開始検出信号が1になってから終了検出信号が1になっているまでの間の信号(画素)を文字(字幕)の一部として、この区間のenable信号を1とする(ステップS212)。そして、パラメータxに1をインクリメントする(ステップS213)。
そして、2つ目の輝度差分値を用いた文字情報検出処理が終了したかどうかをパラメータxが2よりも大きいかどうかで判断する(ステップS214)。その結果、終了したと判断された場合(Yes)はステップS215に進む。一方、ステップS214でまだ2つ目の輝度差分値を用いた処理が終了していないと判断された場合(No)はステップS202に戻る。
上述した処理ではまだパラメータxが1のときの処理が終わっただけであり、2つ目の輝度差分値に対する処理がなされていない。すなわち、ステップS213でx=2となった状態であり、ステップS202の処理に戻ることになる。
ステップS202では、第1の輝度差分値d1,nについて行った上記処理の結果を用いて第2の輝度差分値dn2を求める。すなわち、注目画素Pnとその隣接画素である画素Pn+1,Pn−2が有する輝度成分をそれぞれYn,Yn+1,Yn−2とすると、注目画素の第1の輝度差分値d1,nは前述のようにYn−Yn−1,Yn+1−Yn−2等で計算した。そして、第2の輝度差分値は、注目画素における第1の輝度差分値と少なくとも1つ以上のその周辺画素における第1の輝度差分値との和(例えば、d1,n−1+d1,n,d1,n−2+d1,n―1+d1,n等)で検出することとするこのように第1の輝度差分値の和を用いることで、改めて輝度差分値を各画素について行う必要がなく、装置での演算量を少なくすることができる。尚、これらの2つの画素で計算した輝度差分値は、正確には注目画素Pnの輝度差分値ではない場合もあるが注目画素Pnに近い画素位置での輝度差分値であるため、第1の輝度差分値d1,nを補うデータとして本実施形態では用いている。
以下、第2の輝度差分値について上述した処理2の処理を行う。
すなわち、字幕の開始位置を特定するために、映像信号が黒→白へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字開始画素候補として検出する(ステップS203)。
・条件1:処理1で得られた第2の輝度差分値が正であり、かつ当該輝度差分値が第1閾値A以上であること…d2,n≧A>0
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B
・条件3:注目画素Pnの色差成分Cb、Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること
すなわち、字幕の開始位置を特定するために、映像信号が黒→白へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字開始画素候補として検出する(ステップS203)。
・条件1:処理1で得られた第2の輝度差分値が正であり、かつ当該輝度差分値が第1閾値A以上であること…d2,n≧A>0
・条件2:注目画素Pnの輝度Ynが第2閾値B以上であること…Yn≧B
・条件3:注目画素Pnの色差成分Cb、Crの絶対値(大きさ)が第3閾値I以下、すなわち0付近の値であること
ステップS203で上記条件1〜3を全て満たす場合(Yes)、注目画素Pnを字幕開始画素候補として記録し(水平ライン中の画素の位置を示すパラメータedge2にnを割り当てる)、開始検出信号Start(n)を1にする(ステップS204)。一方、ステップS203でそれ以外の場合(No)、開始検出信号Start(n)を0にする(ステップS205)。
尚、前述したように本実施形態では色差成分Cb,Crがオフセット・バイナリ表現であるため、ステップS203の処理における色差成分Cb,Crが0付近であることの検出は、色差成分Cb,Crと一定値Hb,Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求め、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。
次いで、上述した処理3の処理を実行する。当該処理では、字幕の終了位置を特定するために、映像信号が白→黒へ変化している部分の検出を行う。本実施形態では以下の条件をすべて満たす画素を文字終了画素候補として検出する(ステップS206)。
・条件1:処理1で得られた第2の輝度差分値が負であること…d2,n<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|d2,n|≧C
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D
・条件4:注目画素Pnの色差成分Cb、Crが0付近であること
・条件1:処理1で得られた第2の輝度差分値が負であること…d2,n<0
・条件2:上記輝度差分値の絶対値(大きさ)が第4閾値C以上であること…|d2,n|≧C
・条件3:注目画素Pnの輝度値Ynが第5閾値D以下であること…Yn≦D
・条件4:注目画素Pnの色差成分Cb、Crが0付近であること
ステップS106で上記条件1〜4を全て満たす場合(Yes)、注目画素Pnを字幕終了画素候補として終了検出信号End(n)を1にする(ステップS207)。一方、ステップS206でそれ以外の場合(No)、終了検出信号End(n)を0にする(ステップS208)。
尚、処理3においても色差成分Cb,Crが0付近であることの検出は、Cb,Crがオフセット・バイナリ表現であるため、色差成分Cb,Crと一定値Hb,Hr(画像が8ビット表現の時はHb=Hr=128となる)との差を求めて、その差の絶対値が第3の閾値I以下であることで行っている(|Cb−Hb|≦I & |Cr−Hr|≦I)。
次いで、白から黒への変化を検出した時、すなわち字幕終了画素候補が検出された時の水平位置と文字開始画素候補の水平位置との差の確認を行う。本実施形態では、文字開始画素候補と文字終了画素候補の画像上の距離(n−edge2)が第6閾値Eよりも小さいか否かを判断する(ステップS209)。すなわち、本実施形態では字幕を構成する文字の線の幅をE画素程度とした。そして、以下に示すように、開始検出信号が1になってからE画素間のうちに終了検出信号が1にならない場合は、そのときの開始検出信号を0にし、次の開始検出信号を探すようにしている。
ステップS209の判断の結果、当該距離がE画素以上である場合(No)、文字開始画素候補及び文字終了画素候補はそれぞれ文字開始画素及び文字終了画素ではないとして、この時の開始検出信号Start(edge2)及び終了検出信号End(n)を無効とし、それぞれに0を割り当てる(ステップS211)。
一方、文字開始画素候補と文字終了画素候補間の画素数(n−edge2)が第6閾値Eより小さい場合(ステップS209でYesの場合)、文字開始画素候補及び文字終了画素候補をそれぞれ第2の文字開始画素及び第2の文字終了画素とする。すなわち、開始検出信号Start(edge2)及び終了検出信号End(n)の値に1を割り当てる(ステップS210)。そして、開始検出信号が1になってから終了検出信号が1になっているまでの間の信号(画素)を文字(字幕)の一部として、この区間のenable信号を1にする(ステップS212)。また、パラメータxに1をインクリメントする(ステップS213)。ここで、パラメータxは3になっている。
次いで、ステップS214で2つ目の輝度差分値を用いた文字情報検出処理が終了したか否かが判断される。その結果、x=3でありx>2であるため処理が終了したと判断され(Yes)、ステップS215に進む。そして、水平位置を示すパラメータnに1をインクリメントし(ステップS215)、ステップS216に進む。
ステップS216では、上記処理を一水平ライン分について行ったか否かを判断する。すなわち、ステップS216でn<Pmaxと判断される場合(Yes)は、まだ一ライン分の処理を行ってないとしてステップS202に戻って上記処理を繰り返す。一方、ステップS216でn≧Pmaxと判断される場合(No)は、上記処理を一ライン分行ったとしてステップS217に進む。ステップS217では、映像信号内の各ラインの処理で検出されたenable信号が1になっている画素群を字幕を構成する画素として検出する。すなわち、2つの輝度差分値のそれぞれについて検出されたenable信号が1になっている信号の論理和に基づいて映像信号の文字情報が検出できる。このように本実施形態では、各ライン単位で文字情報検出処理を行うので文字検出装置にフレームメモリを持たせる必要がなく、ラインメモリを持たせるだけでよい。ステップS217の文字検出処理の後、次のラインに進むために垂直ラインの位置を示すパラメータmに1をインクリメントする(ステップS218)。そして、全ラインについて前述した処理が終了したか否かを判断する(ステップS219)。
その結果、ステップS219でパラメータmの値がQmax以下と判断された場合(Yes)は、ステップS202に戻って上記処理を繰り返す。一方、ステップS219で全ラインについての処理が終了したと判断された場合(No)は、本処理を終了する。
尚、上述の処理で用いる各閾値A,B,C,D,E,Iには、経験値(固定値)或いは対象となる映像信号の種類(素材、チャンネル等)に応じた可変値を用いることができる。したがって、上記処理を行う装置に、経験値である固定の閾値を保持する構成、或いは、各閾値A,B,C,D,E,Iのそれぞれに複数の値をとることができるような構成を保持させておいて映像信号の種類に応じて閾値を選択する構成、或いは映像信号として入力される画像の平均輝度値等から閾値を計算して決定するような構成等を付加するようにしてもよい。
上述したように、本実施形態に係る文字情報検出方法によれば、ビデオ画像中に挿入されている字幕を挿入形式にかかわらず画像中から精度よく検出することができる。すなわち、字幕がシネマスコープサイズの形態で記録されているかいないかには全く関係なく字幕を精度よく検出することができる。そして、この際に1つの輝度差分値だけでは検出できなかったような縁取りであっても、その他の輝度差分値を用いることによって文字情報を検出することが可能となる。
尚、上述した第1及び第2の実施形態では、全ラインの処理が終了した後に字幕構成画素を検出するのではなく、いずれも各ライン処理で検出されたenable信号が1になっている画素群を字幕を構成する画素として検出している。これによってフレームメモリを文字情報検出装置の構成要素にする必要がなくラインメモリを備えるだけでよいものとしている。尚、当該文字情報検出装置からあるラインについての画素群を出力するタイミングは次のライン処理の実行中でなくても、全ライン処理終了後でなければ、例えば複数のライン単位で行うようにしてもよい。
<映像信号処理装置>
ここでは、上述した実施形態で説明した文字情報検出処理を行う文字情報検出装置として、DVDプレーヤ、ブルーレイディスクプレーヤ及びディスプレイ装置等に内蔵或いは外部接続等される映像信号処理装置の構成及び動作について説明する。
ここでは、上述した実施形態で説明した文字情報検出処理を行う文字情報検出装置として、DVDプレーヤ、ブルーレイディスクプレーヤ及びディスプレイ装置等に内蔵或いは外部接続等される映像信号処理装置の構成及び動作について説明する。
図5は、本発明の一実施形態に係る文字情報検出処理を行う映像信号処理装置の構成図である。また、図6は、図5に示す映像信号処理装置での文字情報検出処理の様子を説明するための図である。
図5に示すように、ビデオデータ入力部51から入力される走査された映像信号(一ラインの映像データ)はラインメモリ(Line Memory)52に一旦蓄えられる。そして、ラインメモリ52に蓄積されたデータを読み出す際に、字幕検出部53における文字情報検出処理で生成したenable信号と照らし合わせて、字幕検出時輝度調整部54で輝度調整が行われる。そして、輝度調整が行われたビデオデータはビデオデータ出力部55から出力される。
輝度調整は、図6に示すようにラインメモリ52からビデオデータを読み出し、enable信号が1の注目画素Pnの輝度Ynがある値Fより大きい場合には決められた値に調整を行うようにする。例えば、輝度YnがF以上の場合はF、或いはある値Gまでしかとらないように変換を行うようにする。
図7は、本発明の一実施形態に係る文字情報検出装置の構成を示すブロック図である。本実施形態において文字情報検出装置は以下に示すような構成を有する。
・輝度成分及び色差成分を有する画素が所定方向に配列された映像信号が入力される映像信号入力手段である映像信号入力部71
・注目画素周辺の画素が有する輝度成分から差分値を検出する差分値検出手段である差分値検出部72
・差分値検出部72で得られた差分値が第1閾値A以上であり、かつ注目画素の輝度成分の値が第2閾値B以上であり、かつ色差成分の絶対値が第3閾値I以下のときに、注目画素の位置を開始位置とする開始位置検出手段である開始位置検出部73
・差分値検出部72で得られた差分値が第4閾値C以下であり、かつ注目画素の輝度成分の値が第5閾値D以下であり、かつ色差成分の絶対値が第3閾値I以下のときに、注目画素の位置を終了位置とする終了位置検出手段である終了位置検出部74
・開始位置検出部73及び終了位置検出部74で得られた終了位置と開始位置との差が第6の閾値Eより小さいときに文字情報検出信号を出力する文字情報検出手段である文字情報検出部75
・輝度成分及び色差成分を有する画素が所定方向に配列された映像信号が入力される映像信号入力手段である映像信号入力部71
・注目画素周辺の画素が有する輝度成分から差分値を検出する差分値検出手段である差分値検出部72
・差分値検出部72で得られた差分値が第1閾値A以上であり、かつ注目画素の輝度成分の値が第2閾値B以上であり、かつ色差成分の絶対値が第3閾値I以下のときに、注目画素の位置を開始位置とする開始位置検出手段である開始位置検出部73
・差分値検出部72で得られた差分値が第4閾値C以下であり、かつ注目画素の輝度成分の値が第5閾値D以下であり、かつ色差成分の絶対値が第3閾値I以下のときに、注目画素の位置を終了位置とする終了位置検出手段である終了位置検出部74
・開始位置検出部73及び終了位置検出部74で得られた終了位置と開始位置との差が第6の閾値Eより小さいときに文字情報検出信号を出力する文字情報検出手段である文字情報検出部75
図7に示すような構成を有する文字情報検出装置は、前述した第1及び第2の実施形態で説明した文字情報検出方法のための動作を行う。尚、上述の処理で用いる各閾値A,B,C,D,E,F,G,Iには、経験値(固定値)或いは対象となる映像信号の種類(素材、チャンネル等)に応じた可変値を用いることができる。したがって、本実施形態に係る上記処理を行う装置に、経験値である固定の閾値を保持する構成、或いは、各閾値A,B,C,D,E,F,G,Iのそれぞれに複数の値をとることができるような構成を保持させておいて映像信号の種類に応じて閾値を選択する構成、或いは映像信号として入力される画像の平均輝度値等から閾値を計算して決定するような構成等を付加するようにしてもよい。
上述した実施形態で説明した本発明に係る文字情報検出方法では、画素単位での字幕の検出をするために字幕の特性を利用して一次微分値や色差を字幕判定項目に加えたことにより、検出の精度が従来よりも飛躍的に向上させることができる。すなわち、字幕が本編のビデオ画像中に存在するような場合においても、字幕そのものを精度よく検出することができる。また、字幕の輝度を制御することができるため、家庭でプロジェクタ等を使用して暗い部屋で映画を観賞する際においても、字幕が眩しく、観賞の邪魔になることを防ぐことができる。
また、本実施形態に係る映像信号処理装置ではフィールドメモリやフレームメモリを用いることなく、ラインメモリ程度で構成可能であるため、外付けメモリ等が不要で、安価な映像システムを構成することができる。
さらに、本実施形態に係る映像信号処理装置では自動的に字幕部分のみを検出して,字幕部分の輝度を調整しているが、ユーザが何段階かのレベルのうちから好みのレベルを選択できるようにしてもよい。
さらにまた、本発明はDVDプレーヤ、DVDレコーダ、ブルーレイディスクプレーヤ、ブルーレイレコーダ、ディジタル放送対応テレビ、ディスプレイ装置等にも応用することができる。
<その他の実施形態>
上述した各実施形態では、画像信号中の各画素の輝度成分Y及び色差成分Cb、Crを用いて演算を行っている。従って、YCbCr映像信号が直接入力される場合だけでなく演算によってYCbCr映像信号に色空間変換できるような映像信号、例えばRGB映像信号であれば色空間を変換することで同様の処理が可能である。したがって、HDMI端子やDVI−D端子等のようなディジタル画像信号や、DVI−I端子、アナログRGB端子、コンポーネント端子、D端子等のようなアナログ画像信号のいずれであっても、演算によってYCbCr映像信号に色空間変換ができるものであれば同様に処理が可能である。
上述した各実施形態では、画像信号中の各画素の輝度成分Y及び色差成分Cb、Crを用いて演算を行っている。従って、YCbCr映像信号が直接入力される場合だけでなく演算によってYCbCr映像信号に色空間変換できるような映像信号、例えばRGB映像信号であれば色空間を変換することで同様の処理が可能である。したがって、HDMI端子やDVI−D端子等のようなディジタル画像信号や、DVI−I端子、アナログRGB端子、コンポーネント端子、D端子等のようなアナログ画像信号のいずれであっても、演算によってYCbCr映像信号に色空間変換ができるものであれば同様に処理が可能である。
また、上述した各実施形態で検出した字幕を他の色に変換する色変換手段である色変換部を本発明の処理を行う装置に付加してもよい。このような処理を行うことにより、色覚に障害を持つユーザが映像信号中の字幕の色を感知しにくい場合、それを判別しやすい色に調節して読みやすくすることが可能となる。例えば、赤緑色覚障害の人は、一般に赤〜緑の波長域において明度が類似した色の見分けが困難なことが多い。そこで、このような赤緑色覚障害の人がユーザの場合には、当該装置では赤〜緑の色差を文字検出のための色差として保持しておき、当該色差の文字を検出し、検出された文字の文字色を例えば青色に変更する、或いは文字の輝度を調節(上げる/下げる)等の処理を行うようにすればよい。
さらに、上述した実施形態では、画像の水平方向ラインについての処理について説明しているが、画像の垂直方向ラインについて同様の処理を行うことも可能である。但し、この場合は前述した実施形態のようにラインメモリでは構成が困難となることが考えられ得るので、フィールドメモリやフレームメモリを用いた装置構成をする必要がある。
さらにまた、上述した本発明の実施形態はシステム、装置等を構成するコンピュータにインストールされたプログラム、又は当該プログラムを格納したフレキシブルディスク、ハードディスク、MO、CD、DVD、USBメモリ等の各種の記憶媒体の形態をとることも可能である。
51 ビデオデータ入力部
52 ラインメモリ
54 字幕検出時輝度調整部
71 映像信号入力部
72 差分値検出部
73 開始位置検出部
74 終了位置検出部
75 文字情報検出部
52 ラインメモリ
54 字幕検出時輝度調整部
71 映像信号入力部
72 差分値検出部
73 開始位置検出部
74 終了位置検出部
75 文字情報検出部
Claims (15)
- 映像信号に含まれる文字情報を検出する文字情報検出方法であって、
前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の絶対値を該映像信号内の他画素の値と比較して前記画素が文字開始画素かどうかを判定することにより文字開始画素を検出する第1の工程と、
前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の絶対値を該映像信号内の他画素の値と比較して前記画素が文字終了画素かどうかを判定することにより文字終了画素を検出する第2の工程と、
前記映像信号内の前記文字開始画素から前記文字終了画素までの間の画素群の長さで該画素群が文字情報かどうかを判定することにより文字情報を検出する第3の工程と
を有することを特徴とする文字情報検出方法。 - 映像信号に含まれる文字情報を検出する文字情報検出方法であって、
前記映像信号内の画素の周辺画素間の輝度差分値を検出する第1の工程と、
前記輝度差分値が第1閾値以上、かつ前記画素の輝度値が第2閾値以上、かつ前記画素の色差の絶対値が第3閾値以下のときに、該画素を文字開始画素とする第2の工程と、
前記輝度差分値が第4閾値以下、かつ前記画素の輝度値が第5閾値以下、かつ前記画素の色差の絶対値が前記第3閾値以下のときに、該画素を文字終了画素とする第3の工程と、
前記映像信号内の前記文字開始画素から前記文字終了画素までの間の長さが第6閾値よりも小さいときに、該画素群を文字情報として検出する第4の工程と
を有することを特徴とする文字情報検出方法。 - 前記映像信号に含まれる黒色で縁取りされた白色の文字を構成する画素群を前記文字情報として検出することを特徴とする請求項1又は2に記載の文字情報検出方法。
- 前記周辺画素間の輝度差分値が、前記映像信号内の一列に配列された画素列中の画素Pn(nは1以上の整数)の一方の隣接画素Pn−1の輝度値と該画素Pnのもう一方の隣接画素Pn+1の輝度値の差分であることを特徴とする請求項1から3までのいずれか1項に記載の文字情報検出方法。
- 前記画素Pnの2つ以上の周辺画素Pn−1,Pn−2,…と前記画素Pnのもう一方の隣接画素Pn+1との間でそれぞれ文字情報を検出し、検出された複数の文字情報の論理和を前記映像信号の文字情報として検出することを特徴とする請求項4に記載の文字情報検出方法。
- 映像信号に含まれる文字情報を検出する文字情報検出方法であって、
前記映像信号内の一列に配列された画素列中の注目画素Pn(nは1以上の整数)に隣接する画素Pn+1の輝度値と該注目画素Pnのもう一方に隣接する画素Pn−1の輝度値の差分Pn+1−Pn−1、又は前記注目画素Pnの輝度値と該注目画素Pnの隣接画素Pn−1の輝度値の差分Pn−Pn−1を前記注目画素Pnにおける第1差分値として検出し、前記注目画素Pnにおける第1差分値と該注目画素Pnの少なくとも1つ以上の周辺画素Pn−1,Pn−2,…における第1差分値との和を第2差分値として検出する第1工程と、
前記第1差分値が第1閾値以上、かつ前記注目画素Pnの輝度値が第2閾値以上、かつ前記注目画素Pnの色差の絶対値が第3閾値以下のときに、前記注目画素Pnを第1文字開始画素候補とし、前記第2差分値が前記第1閾値以上、かつ前記注目画素Pnの輝度値が前記第2閾値以上、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字開始画素候補とする第2工程と、
前記第1差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第1文字終了画素候補とし、前記第2差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が前記第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字終了画素候補とする第3工程と、
前記第1文字開始画素候補から前記第1文字終了画素候補までの間の画素群の長さが第6閾値よりも小さいときに、前記第1文字開始画素候補を文字開始画素とし、前記第1文字終了画素候補を文字終了画素として前記画素群を文字情報として検出する第3工程と、
前記第1文字開始位置候補から前記第1文字終了位置候補までの間の長さが前記第6閾値以上であって、前記第2文字開始位置候補から前記第2文字終了位置候補までの間の距離が前記第6閾値よりも小さいときに、前記第2文字開始位置候補を文字開始位置とし、前記第2文字終了位置候補を文字終了位置として前記画素群を文字情報として検出する第4工程と
を有することを特徴とする文字情報検出方法。 - 映像信号に含まれる文字情報を検出する文字情報検出装置であって、
前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の大きさを該映像信号内の他画素の値と比較して前記画素が文字開始画素かどうかを判定することにより文字開始画素を検出する開始位置検出手段と、
前記映像信号内の画素の輝度値、及び該画素の周辺画素間の輝度差分値、前記画素の色差の大きさを該映像信号内の他画素の値と比較して前記画素が文字終了画素かどうかを判定することにより文字終了画素を検出する終了位置検出手段と、
前記映像信号内の前記文字開始画素から前記文字終了画素までの間の画素群の長さで該画素群が文字情報かどうかを判定することにより文字情報を検出する文字情報検出手段と
を備えることを特徴とする文字情報検出装置。 - 映像信号に含まれる文字情報を検出する文字情報検出装置であって、
前記映像信号内の画素の周辺画素間の輝度差分値を検出する差分値検出手段と、
前記輝度差分値が第1閾値以上、かつ前記画素の輝度値が第2閾値以上、かつ前記画素の色差の絶対値が第3閾値以下のときに、該画素を文字開始画素とする開始位置検出手段と、
前記輝度差分値が第4閾値以下、かつ前記画素の輝度値が第5閾値以下、かつ前記画素の色差の絶対値が前記第3閾値以下のときに、該画素を文字終了画素とする終了位置検出手段と、
前記映像信号内の前記文字開始画素から前記文字終了画素までの間の長さが第6閾値よりも小さいときに、該文字開始画素と該文字終了画素との間の画素群を文字情報として検出する文字情報検出手段と
を備えることを特徴とする文字情報検出装置。 - 前記映像信号に含まれる黒色で縁取りされた白色の文字を構成する画素群を前記文字情報として検出することを特徴とする請求項7又は8に記載の文字情報検出装置。
- 前記周辺画素間の輝度差分値が、前記映像信号内の一列に配列された画素列中の画素Pn(nは1以上の整数)の一方の隣接画素Pn−1の輝度値と該画素Pnのもう一方の隣接画素Pn+1の輝度値の差分Pn+1−Pn−1、又は前記画素Pnの輝度値と該画素Pnの隣接画素Pn−1の輝度値の差分Pn−Pn−1であることを特徴とする請求項7から9までのいずれか1項に記載の文字情報検出装置。
- 前記画素Pnの2つ以上の周辺画素Pn−1,Pn−2,…と前記画素Pnのもう一方の隣接画素Pn+1との間、又は前記画素Pnと該画素Pnの隣接画素Pn−1との間でそれぞれ文字情報を検出し、検出された複数の文字情報の論理和を前記映像信号の文字情報として検出することを特徴とする請求項10に記載の文字情報検出装置。
- 映像信号に含まれる文字情報を検出する文字情報検出装置であって、
前記映像信号内の一列に配列された画素列中の注目画素Pn(nは1以上の整数)に隣接する画素Pn+1の輝度値と該注目画素Pnのもう一方に隣接する画素Pn−1の輝度値の差分Pn+1−Pn−1、又は前記注目画素Pnの輝度値と該注目画素Pnの隣接画素Pn−1の輝度値の差分Pn−Pn−1を前記注目画素Pnにおける第1差分値として検出し、前記注目画素Pnにおける第1差分値と該注目画素Pnの少なくとも1つ以上の周辺画素Pn−1,Pn−2,…における第1差分値との和を第2差分値として検出する差分値検出手段と、
前記第1差分値が第1閾値以上、かつ前記注目画素の輝度値が第2閾値以上、かつ前記注目画素の色差の絶対値が第3閾値以下のときに、前記注目画素Pnを第1文字開始画素候補とし、前記第2差分値が前記第1閾値以上、かつ前記注目画素Pnの輝度値が前記第2閾値以上、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字開始画素候補とする開始位置検出手段と、
前記第1差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第1文字終了画素候補とし、前記第2差分値が第4閾値以下、かつ前記注目画素Pnの輝度値が前記第5閾値以下、かつ前記注目画素Pnの色差の絶対値が前記第3閾値以下のときに、前記注目画素Pnを第2文字終了画素候補とする終了位置検出手段と、
前記第1文字開始画素候補から前記第1文字終了画素候補までの間の長さが第6閾値よりも小さいときに、前記第1文字開始画素候補を文字開始画素とし、前記第1文字終了画素候補を文字終了画素として前記画素群を文字情報として検出するとともに、
前記第1文字開始位置候補から前記第1文字終了位置候補までの間の長さが前記第6閾値以上であって、前記第2文字開始位置と前記第2文字終了位置との間隔が前記第6閾値よりも小さいときに、前記第2文字開始位置候補を文字開始位置とし、前記第2文字終了位置候補を文字終了位置として前記画素群を文字情報として検出する文字情報検出手段と
を備えることを特徴とする文字情報検出装置。 - 映像信号に含まれる文字情報を検出して文字情報検出信号を出力する請求項7から12までのいずれか1項に記載の文字情報検出装置と、
前記映像信号を所定期間蓄積する記憶装置と、
前記文字情報検出信号に基づいて前記映像信号に含まれる文字情報の輝度を調整する輝度調整手段と
を備えることを特徴とする映像信号処理装置。 - 請求項1から6までのいずれか1項に記載の文字情報検出方法をコンピュータに実行させるためのプログラム。
- 請求項14に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009182473A JP2011033982A (ja) | 2009-08-05 | 2009-08-05 | 文字情報検出方法及び文字情報検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009182473A JP2011033982A (ja) | 2009-08-05 | 2009-08-05 | 文字情報検出方法及び文字情報検出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011033982A true JP2011033982A (ja) | 2011-02-17 |
Family
ID=43763094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009182473A Pending JP2011033982A (ja) | 2009-08-05 | 2009-08-05 | 文字情報検出方法及び文字情報検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011033982A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013103007A1 (ja) * | 2012-01-05 | 2013-07-11 | Necディスプレイソリューションズ株式会社 | 画像表示装置及び光源制御方法 |
CN112333401A (zh) * | 2019-08-05 | 2021-02-05 | 福州瑞芯微电子股份有限公司 | 一种运动字幕区域检测方法、装置、系统、介质及设备 |
-
2009
- 2009-08-05 JP JP2009182473A patent/JP2011033982A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013103007A1 (ja) * | 2012-01-05 | 2013-07-11 | Necディスプレイソリューションズ株式会社 | 画像表示装置及び光源制御方法 |
CN112333401A (zh) * | 2019-08-05 | 2021-02-05 | 福州瑞芯微电子股份有限公司 | 一种运动字幕区域检测方法、装置、系统、介质及设备 |
CN112333401B (zh) * | 2019-08-05 | 2022-11-01 | 瑞芯微电子股份有限公司 | 一种运动字幕区域检测方法、装置、系统、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103167293B (zh) | 显示系统 | |
US8111328B2 (en) | Image signal processing apparatus, image display, and image display method | |
US8098328B2 (en) | Image signal processing apparatus, image display and image display method | |
US7929611B2 (en) | Frame rate converting apparatus, pan/tilt determining apparatus, and video apparatus | |
US20070286480A1 (en) | Image processing apparatus and method | |
US8059169B2 (en) | Apparatus and method for compensating color, and image processor, digital processing apparatus, recording medium using it | |
JP5539297B2 (ja) | 表示システム、較正方法、コンピュータプログラム、及び記録媒体 | |
JP5056501B2 (ja) | 撮像装置及びこれに用いる欠陥画素補正方法 | |
KR101346520B1 (ko) | 화상 보정 회로, 화상 보정 방법 및 화상 표시 장치 | |
CN113225475A (zh) | 显示控制设备、显示控制方法和计算机可读介质 | |
JP2006229781A (ja) | 映像変換装置及び映像表示装置 | |
KR102575281B1 (ko) | 결함화소 정보 기록장치, 결함화소 보정장치 및 방법 | |
US11233985B2 (en) | Method for video quality detection and image processing circuit using the same | |
TWI491974B (zh) | 圖像黑印查找系統及方法 | |
JP2011033982A (ja) | 文字情報検出方法及び文字情報検出装置 | |
JP2017156365A (ja) | 液晶表示装置 | |
EP1441518B1 (en) | Characteristic correcting device | |
JP5539298B2 (ja) | 表示システム、較正方法、コンピュータプログラム、及び記録媒体 | |
JP5084615B2 (ja) | 画像表示装置 | |
JP2009253637A (ja) | 画像処理装置と画像処理方法および撮像装置 | |
JP2007124453A (ja) | 画像表示装置 | |
JP5057053B2 (ja) | ガンマ切替装置および方法 | |
US7333668B2 (en) | Image data compressing apparatus and image data extracting apparatus | |
US20240348940A1 (en) | Imaging apparatus configured to generate raw image, control method, and storage medium | |
US11871124B2 (en) | Image capturing apparatus, method of controlling the same, and non-transitory computer-readable storage medium |