JPWO2011027422A1 - 画像処理装置および映像再生装置 - Google Patents

画像処理装置および映像再生装置 Download PDF

Info

Publication number
JPWO2011027422A1
JPWO2011027422A1 JP2011529716A JP2011529716A JPWO2011027422A1 JP WO2011027422 A1 JPWO2011027422 A1 JP WO2011027422A1 JP 2011529716 A JP2011529716 A JP 2011529716A JP 2011529716 A JP2011529716 A JP 2011529716A JP WO2011027422 A1 JPWO2011027422 A1 JP WO2011027422A1
Authority
JP
Japan
Prior art keywords
character
pixel
frame
image processing
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011529716A
Other languages
English (en)
Other versions
JP5377649B2 (ja
Inventor
和昭 寺島
和昭 寺島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Publication of JPWO2011027422A1 publication Critical patent/JPWO2011027422A1/ja
Application granted granted Critical
Publication of JP5377649B2 publication Critical patent/JP5377649B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

文字の画素の輝度が文字以外の画素の輝度よりも高くない場合でも、動画像内の文字の位置を検出することができる画像処理装置および映像再生装置を提供する。動きベクトル生成部(13)は、第1フレームの画像と、第2フレームの画像との動きベクトルを生成する。エッジ検出部(4)は、第1フレームの画像のエッジを構成するエッジ画素を検出する。文字位置検出部(6)は、第1フレームの画像の画素ごとの、動きベクトル、輝度、およびエッジ画素が否かの情報に基づいて、第1フレームの画像に含まれる文字の位置を検出する。

Description

本発明は、画像処理装置に関し、特に、動画像内の文字の位置を検出する機能を有する画像処理装置および映像再生装置に関する。
動画像に含まれる文字の位置を検出するための装置が提案されている。たとえば、特許文献1(特開2009−42897号公報)には、スクロールする文字の位置を検出する画像処理装置が開示されている。この画像処理装置では、抽出部が、入力画像から輝度が所定値よりも高い領域を文字領域として抽出する。動きベクトル算出部は、画像を複数行複数列のブロックに分割し、抽出部で抽出された文字領域を含むブロックに対応する動きベクトルを算出する。スクロール判定部は、動きベクトルの大きさ、向きが同じであるブロックが同一の行または列に所定数よりも多く存在する場合、行または列にスクロールする文字が存在すると判定する。
特開2009−42897号公報
しかしながら、特許文献1の装置は、文字の画素の輝度が文字以外の画素の輝度よりも高いことを前提としている。この前提が存在しない動画像も数多く存在し、そのような動画像については、文字の位置を検出することができない。
それゆえに、本発明の目的は、文字の画素の輝度が文字以外の画素の輝度よりも高くない場合でも、動画像内の文字の位置を検出することができる画像処理装置および映像再生装置を提供することである。
本発明の一実施形態の画像処理装置は、第1フレームの画像と、第2フレームの画像との動きベクトルを生成する動きベクトル生成部と、第1フレームの画像のエッジを構成するエッジ画素を検出するエッジ検出部と、第1フレームの画像の画素ごとの、動きベクトル、輝度、およびエッジ画素が否かの情報に基づいて、第1フレームの画像に含まれる文字の位置を検出する文字位置検出部とを備える。
本発明の一実施形態によれば、文字の画素の輝度が文字以外の画素の輝度よりも高くない場合でも、動画像内の文字の位置を検出することができる。
本発明の実施形態の画像処理装置の構成を表わす図である。 本発明の実施形態の画像処理装置の動作手順を表わすフローチャートである。 (a)は、前フレームの画像の例を表わす図である。(b)は、現在のフレームの画像の例を表わす図である。 ヒストグラムの例を説明するための図である。 文字ラインの特定の例を説明するための図である。 組合せCb2から作成された文字輪郭画素を表わす図である。 図6の文字輪郭画素から生成される文字画素を表わす図である。 図2のフローチャートのステップS103の詳細を表わすフローチャートである。 エッジ画素の検出の例を説明するための図である。 図2のフローチャートのステップS107の詳細を表わすフローチャートである。 図2のフローチャートのステップS114の詳細を表わすフローチャートである。 1つの文字ラインに含まれる文字画素の動きベクトルの例を表わす図である。 時刻T1のフレームの画像の例を表わす図である。 時刻T2のフレームの画像の例を表わす図である。 映像再生装置及びシステムの主要部のブロック構成を示す図である。
以下、本発明の実施形態について図面を参照して説明する。
(構成)
図1は、本発明の実施形態の画像処理装置の構成を表わす図である。
図1を参照して、この画像処理装置1は、フレームメモリ2と、メモリコントローラ3と、動きベクトル生成部13と、エッジ検出部4と、文字位置検出部6と、動きベクトル補正部14と、フレーム補間部10と、文字輪郭強調部9とを備える。
フレームメモリ2は、外部から入力される画像を記憶する。フレームメモリ2は、現在のフレームの1つ前のフレームの画像を動きベクトル生成部13に出力する。
メモリコントローラ3は、フレームメモリ2への画像の入力、およびフレームメモリ2からの画像の出力を制御する。
エッジ検出部4は、現在のフレームの画像を水平方向に走査して、閾値以上の画素が所定個数以上連続したセグメントが存在するときに、セグメントの両端をエッジ画素として検出する。
文字位置検出部6は、現在のフレームの画像の動きベクトルと輝度の組み合わせごとの、組合せを構成する動きベクトルと輝度とを有する画素がエッジ画素である頻度に基づいて文字の位置を検出する。文字位置検出部6は、ヒストグラム生成部5と、文字ライン特定部7と、動き判定部11と、文字輪郭画素特定部8と、文字画素特定部12とを含む。
ヒストグラム生成部5は、画像の動きベクトルと輝度の組合せごとに、その組合せの動きベクトルと輝度とを有する画素がエッジ画素である頻度を表わすヒストグラムを生成する。
文字ライン特定部7は、ヒストグラムの頻度が閾値以上となる動きベクトルと輝度の組合せを特定し、現フレームの画像を構成する水平方向の複数のラインのうち、特定した組合せを構成する輝度の画素の数が閾値以上のラインを文字の画素が含まれる文字ラインとして特定する。
動き判定部11は、ヒストグラムの頻度が閾値以上となる動きベクトルと輝度の組合せを構成する動きベクトルの大きさに応じて、文字ラインに静止文字の画素が含まれるか、あるいは動き文字の画素が含まれるかを判定する。
文字輪郭画素特定部8は、文字ラインに含まれる複数の画素のうち、エッジ画素である画素を文字の輪郭を構成する文字輪郭画素として特定する。
文字画素特定部12は、1つの文字ラインを構成する複数の文字輪郭画素について、その1つの文字ラインの一端(左端)から順番にペアが構成できるときに、ペアを構成する2つの画素と、ペアを構成する2つの画素に挟まれる画素とを文字を構成する文字画素として特定する。
文字輪郭強調部9は、文字輪郭画素を強調処理する。文字輪郭強調部9は、文字輪郭画素が静止文字であるか、動き文字であるかに応じて、強調の程度を変化させる。
動きベクトル補正部14は、1つの文字ラインに含まれる複数の文字画素の動きベクトルを代表する代表ベクトルを特定し、1つの文字ラインに含まれる複数の文字画素の動きベクトルのうち、代表ベクトルと同一でないものについては、代表ベクトルに補正する。
フレーム補間部10は、補正された動きベクトルを用いて、前フレームの画像から前フレームと現フレームの中間のフレームの画像を生成する。
(動作)
図2は、本発明の実施形態の画像処理装置の動作手順を表わすフローチャートである。
図2を参照して、動きベクトル生成部13は、外部から現在のフレーム(第N番目のフレーム)の画像を受け、フレームメモリ2から前フレーム(第(N−1)番目のフレーム)の画像を受ける。図3(a)は、前フレームの画像の例を表わす図である。図3(b)は、現在のフレームの画像の例を表わす図である。ここでは、文字列「HT」を構成する画素の位置が変化し、文字列「DEF]を構成する画素位置が変化していない(ステップS101)。
次に、動きベクトル生成部13は、入力された2つの画像について、画素ごとの動きベクトルを生成する(ステップS102)。
次に、エッジ検出部4は、現在のフレーム(第Nフレーム)の画像のエッジを構成するエッジ画素を検出する(ステップS103)。
次に、ヒストグラム生成部5は、ステップS101で生成した現在のフレームと前フレームとの間の動きベクトルと、現在のフレームの輝度の組合せごとに、その組合せの動きベクトルと輝度とを有する画素がエッジ画素である頻度を表わすヒストグラムを生成する。具体的には、ヒストグラム生成部5は、図4に示すように、X軸に輝度、Y軸に動きベクトルをとり、輝度、動きベクトルの組合せに対するエッジ画素となる頻度をZ軸に対応させる。
たとえば、輝度がx、動きベクトルがyとなる画素が2つある場合に、両方の画素がエッジ画素である場合に、(x,y)に対するzの値(頻度)は2となる。一方だけがエッジ画素である場合に、(x,y)に対するzの値(頻度)が1となる。両方の画素がエッジ画素でない場合には、(x,y)に対するzの値(頻度)が0となる。
ただし、実際には、動きベクトルは、2次元であるため、Y軸は、Y1軸とY2軸とを有する。したがって、実際には、(x,y1,y2)に対する頻度zを求めることになる。このような、ヒストグラムを生成した理由は、通常、文字列「DEF」または文字列「HT」などのような文字列を構成する画素は、すべて輝度および動きベクトルの大きさが同一であり、かつこれらの文字列は、多くのエッジ画素を含むことを前提としたからである。したがって、高い頻度に対応する輝度と動きベクトルの組合せを特定することによって、画像中に特定した輝度と動きベクトルを有する画素からなる文字列が存在することがわかる(ステップS104)。
次に、文字ライン特定部7は、頻度が閾値TH2以上となるものが1個以上あれば(ステップS105でYES)、その頻度を有する輝度と動きベクトルの組合せを特定する。図4の例では、頻度f1に対応する輝度と動きベクトルの組合せCb1と、頻度f2に対応する輝度と動きベクトルの組合せCb2とが存在する。頻度f1は、図3における文字「DEF」に起因するものである。頻度f2は、図3における文字「HT」に起因するものである(ステップS106)。
特定した組合せごとに以下の処理が行なわれる。
まず、文字ライン特定部7は、現在のフレームの画像を構成する水平方向の複数のライン(垂直位置Y)のうち、特定した組合せを構成する輝度の画素の数C(Y)が閾値TH3以上のラインを文字の画素が含まれる文字ラインとして特定する。図5は、文字ラインの特定の例を説明するための図である。図5において、C(Y)が閾値TH3以上のラインの垂直位置はy1〜y2であるため、y1≦y≦y2を満たすような垂直位置yのラインが文字ラインとして特定される。このように、ヒストグラムの頻度が閾値以上の動きベクトルと輝度の組合せの一方の要素である輝度を用いて、文字の画素が含まれる文字ラインを容易に検出することができる(ステップS107)。
次に、動き判定部11は、特定した組合せを構成する動きベクトルの大きさが閾値TH4以下の場合に(ステップS108でYES)、特定した文字ラインに静止文字(つまり、前フレームと現フレームで位置が変化しない文字)が含まれると判定し(ステップS109)、閾値TH4を超える場合に(ステップS108でNO)、文字ラインに動き文字(つまり、前フレームと現フレームで位置が変化した文字)が含まれると判定する。図4のヒストグラムの例では、組合せCb1を構成する動きベクトルの大きさが閾値TH4以下のため、組合わせCb1から作成された文字ラインには静止文字の画素が含まれると判定される。一方、組合せCb2を構成する動きベクトルの大きさが閾値TH4を越えるため、組合せCb2から作成された文字ラインには動き文字の画素が含まれると判定される。このように、ヒストグラムの頻度が閾値以上の動きベクトルと輝度の組合せの他方の要素である動きベクトルを用いて、文字ラインに静止文字の画素が含まれるか、動き文字の画素が含まれるかを容易に判定することができる(ステップS110)。
次に、文字輪郭画素特定部8は、特定された文字ラインに含まれる複数の画素のうち、エッジ画素である画素を文字の輪郭を構成する文字輪郭画素として特定する。図6は、組合せCb2から作成された文字輪郭画素を表わす図である。これにより、文字ラインから文字輪郭画素が容易に抽出できる(ステップS111)。
次に、文字画素特定部12は、1つの文字ラインを構成する複数の文字輪郭画素について、その1つの文字ラインの一端(左端)から順番にペアが構成できるときに、ペアを構成する2つの画素と、ペアを構成する2つの画素に挟まれる画素とを文字を構成する文字画素として特定する。図7は、図6の文字輪郭画素から生成される文字画素を表わす図である。これにより、文字ラインから文字画素が容易に抽出できる(ステップS112)。
次に、文字輪郭強調部9は、特定された文字輪郭画素を強調処理する。たとえば、文字輪郭強調部9は、静止文字の文字輪郭画素の輝度をk1倍(k1>1)し、その文字輪郭画素の左右方向に隣接する画素の輝度をk2倍(k2<1)する。また、文字輪郭強調部9は、動き文字の文字輪郭画素の輝度をk3倍(k3>k1)し、その文字輪郭画素の左右方向に隣接する画素の輝度をk4倍(k4<k2)する。これにより、文字の輪郭が識別しやすくなる。また、動き文字については、動いているため輪郭が識別しにくく、かつ強調してもノイズが目立たない特徴を有するために、強めに強調することができる。静止文字については、輪郭が識別しやすく、かつ強調するとノイズが目立つという特徴を有するので、動き文字よりも弱めに強調することができる(ステップS113)。
次に、動きベクトル補正部14とフレーム補間部10は、動きベクトルの補正およびフレームの補間を行なって現フレームと前フレームの中間のフレームの画像を生成する(ステップS114)。
(エッジ検出)
図8は、図2のフローチャートのステップS103の詳細を表わすフローチャートである。
図8を参照して、まず、エッジ検出部4は、垂直位置Yを1に設定する(ステップS201)。
次に、エッジ検出部4は、水平位置Xを1に設定する(ステップS202)。
次に、エッジ検出部4は、(X、Y)位置の画素の輝度が閾値TH1以上であれば(ステップS203でYES)、その画素の位置を高輝度画素リストに登録する(ステップS204)。
次に、エッジ検出部4は、水平位置Xが画像の水平方向の大きさXSIXEと等しくなければ(ステップS205でNO)、水平位置Xを1だけインクリメントして(ステップS206)、ステップS203に戻る。また、エッジ検出部4は、水平位置Xが画像の水平方向の大きさXSIXEと等しければ(ステップS205でYES)、次のステップS207に移行する。
次に、エッジ検出部4は、高輝度画素リストを参照して、垂直位置Yについて、N個以上連続した高輝度の画素のセグメントがある場合には(ステップS207でYES)、そのセグメントの両端をエッジ画素として設定する。たとえば、図9に示すように、閾値TH1以上の画素が水平方向にN個(ここでは、4個とする)以上連続したセグメントがある場合には、セグメントの両端の画素である、水平位置がx1である画素と、水平位置がx2である画素とがエッジ画素に設定される。これにより、エッジ画素を容易に抽出することができる(ステップS208)。
次に、エッジ検出部4は、垂直位置Yが画像の垂直方向の大きさYSIXEと等しくなければ(ステップS209でNO)、垂直位置Yを1だけインクリメントして(ステップS210)、ステップS202に戻る。また、エッジ検出部4は、垂直位置Yが画像の垂直方向の大きさYSIXEと等しければ(ステップS209でYES)、終了する。
(文字ラインの特定)
図10は、図2のフローチャートのステップS107の詳細を表わすフローチャートである。
図10を参照して、文字ライン特定部7は、ヒストグラムの頻度が閾値TH2以上となる輝度と動きベクトルの組合せを構成する輝度Aを特定する。
次に、文字ライン特定部7は、垂直位置Yを1に設定し、カウントC(1)を0に設定する(ステップS302)。
次に、文字ライン特定部7は、水平位置Xを1に設定する(ステップS304)。
次に、文字ライン特定部7は、(X,Y)位置の画素の輝度が輝度Aであれば(ステップS304でYES)、カウントC(Y)を1だけインクリメントする(ステップS305)。
次に、文字ライン特定部7は、水平位置Xが画像の水平方向の大きさXSIXEと等しくなければ(ステップS306でNO)、水平位置Xを1だけインクリメントして(ステップS307)、ステップS304に戻る。また、文字ライン特定部7は、水平位置Xが画像の水平方向の大きさXSIXEと等しければ(ステップS306でYES)、次のステップS308に移行する。
次に、文字ライン特定部7は、カウント値C(Y)が閾値TH3以上であれば(ステップS308でYES)、垂直位置Yのラインを文字ラインとして特定する(ステップS309)。
次に、文字ライン特定部7は、垂直位置Yが画像の垂直方向の大きさYSIXEと等しくなければ(ステップS310でNO)、垂直位置Yを1だけインクリメントし、カウントC(Y)を0に設定し(ステップS311)、ステップS303に戻る。また、文字ライン特定部7は、垂直位置Yが画像の垂直方向の大きさYSIXEと等しければ(ステップS310でYES)、終了する。
(フレーム補間)
図11は、図2のフローチャートのステップS114の詳細を表わすフローチャートである。
図11を参照して、まず、動きベクトル補正部14は、1つの文字ラインに含まれる複数の文字画素の動きベクトルが同一でない場合には(ステップS401でYES)、その文字ラインの文字画素の動きベクトルを代表する代表ベクトルを特定する。具体的には、動きベクトル補正部14は、1つの文字ラインの複数の文字画素の動きベクトルのうち、頻度が最も高い動きベクトルを代表ベクトルにする。図12は、1つの文字ラインに含まれる文字画素の動きベクトルの例を表わす図である。同図において、垂直位置y1の文字ラインの文字画素のうち、動きベクトルV1を有するものと、動きベクトルV2とを有するものと、動きべクトルV3を有するものがある。この場合には、動きベクトルV1の頻度が最も高いので、代表ベクトルがV1に設定される(ステップS402)。
次に、動きベクトル補正部14は、文字ラインに含まれる各文字画素の動きベクトルが代表ベクトルと同一でない場合には(ステップS403でYES)、その動きベクトルを代表ベクトルに補正する。図12では、動きベクトルV2を有する画素、および動きベクトルV3を有する画素の動きベクトルがV1に補正される。これによって、動きベクトルを用いて中間のフレームを作成する際に、動きベクトルがノイズを含んでいる場合に、補間後の中間のフレームの画像にノイズが生じるのを防止できる(ステップS404)。
次に、フレーム補間部10は、動きベクトルを用いて、前フレームの画像から前フレームと現フレームの中間のフレームの画像を生成する。これによって、フレームレートの倍速化が実現できる(ステップS405)。
(画像処理)
次に上述した画像処理装置を用いて文字の位置を検出した場合に可能となる画像処理について具体的に説明する。上述した画像処理装置は例えばテレビにおける画像処理に用いられる。デジタルテレビでは、画像の圧縮を行うため様々なノイズが発生する。画像の圧縮アルゴリズムではブロック単位で圧縮を行うため、画像の圧縮率を高くした場合に周囲のブロックとの連続性が失われて境界部分が見えるようになりブロックノイズが発生する。また、エッジ画素や色の変化の大きい画素ではモスキートノイズが発生する。さらに、文字に特化すれば背景と文字の色が近い場合、文字と背景のエッジ部分が不明瞭となり、文字の輪郭がぼやけることがある。
図13は、時刻T1のフレームの画像の例を表わす図である。図14は、時刻T2のフレームの画像の例を表わす図である。なお、説明の簡略化のため、文字「T」および背景領域R1それぞれのエッジ画素を囲んで画素領域として示している。
図13および図14では、文字「T」は動きベクトルV11を有し、文字として表示されている。ここで、文字「T」はノイズ領域N1を含んでいる。また、この画像は文字「T」と類似する色を有する背景領域R1を含んでいる。また、この背景領域R1は時刻T1には動きベクトルV21、時刻T2には動きベクトルV22を有している。
時刻T1においては、文字「T」のエッジ画素については明瞭に表示できている。時刻T2においては、文字「T」と背景領域R1の一部の領域が重なる。このとき文字「T」は類似する色を有する背景領域R1と重なるため、その一部のエッジ画素が不明瞭となるとなり、ノイズ領域N2を含むこととなる。
まずノイズ領域N1について説明する。このノイズはブロックノイズに該当する。上述した画像処理装置では、文字輪郭画素を特定することができる。そのため、文字輪郭内の画素に対して、ノイズ消去の処理を行うことでノイズ領域N1を目立たなくすることができる。
次にノイズ領域N2について説明する。ノイズ領域N2においては、文字「T」のエッジ画素が不明瞭となっている。このとき上述した画像処理装置を用いると、文字と背景の色が類似していても、文字の輪郭を特定することが可能である。そのため、文字の輪郭部を強調する処理を行うことで、ノイズ領域N2のように文字の輪郭がぼやけることを抑制することが可能となる。
これらの処理は、図1の文字輪郭強調部9において行われる。説明のため文字輪郭強調部9と特定しているが、文字輪郭の強調に限定されず文字に対する様々な画像処理、例えば文字輪郭内の画像処理を行っても良い。
(適用例)
次に上述した画像処理装置をテレビの映像再生装置に適用した場合の概要を説明する。
図15は、映像再生装置及びシステムの主要部のブロック構成を示す図である。映像再生装置50は、入力部51、入力合成部52、映像処理部53、出力部54を有する。
入力部51の処理を説明する。ます、入力部51に含まれるチューナにて無線処理が行われ、映像データの信号を受信する。受信データは、データの種類ごとに振り分けられデコーダによってデコード処理され所定の形式のデータ(動画プレーン、文字プレーン、静止画プレーン等)が生成される。
次に、入力合成部52の処理を説明する。ここでは入力部にて生成されたデータから、表示画面に対応する1つのまとまりの映像データへと合成する。この入力合成部52において、1つのまとまりの映像データに合成されると、文字部分が映像データに完全に埋め込まれ、分離する事は簡単に出来なくなる。そのため文字部分に対して画像処理を行う場合には、1つのまとまりの映像データの中から正確に文字部分を特定することが重要となる。
入力合成部52にて合成されたデータに対して、映像処理部53にて各種の画像処理が行われる。例えば、各種レイヤごとに輪郭補正やノイズ除去処理を行う。上述した画像処理装置もこの画像処理部53に含まれ、圧縮ノイズ除去回路と併用することで文字部分の画質改善が可能となる。具体的には、上述した画像処理装置から圧縮ノイズ除去回路に対して、文字輪郭情報が伝送され、その情報に基づいて、圧縮ノイズ除去回路では輪郭内に対してノイズ除去処理が実施される。
最後に、出力部54にて映像処理部53にて処理された映像データを表示装置55へ出力する。
以上のように、本発明の実施形態の画像処理装置によれば、文字列を構成する画素は、すべて輝度および動きベクトルの大きさが同一であり、かつこれらの文字列は、多くのエッジ画素を含むことを前提とし、画像の動きベクトルと輝度の組合せごとに、その組合せの動きベクトルと輝度とを有する画素がエッジ画素である頻度を表わすヒストグラムを生成することによって、文字の位置を検出する。これによって、特許文献1に記載の方法では対応できない、文字の画素の輝度が文字以外の画素の輝度よりも高くないような場合でも、動画像内の文字の位置を容易に検出することができる。
また、本発明の実施形態の画像処理装置によれば、パターンマッチングによって画像中の文字を認識することによって文字の位置を検出するような方法に比べて、パターンマッチング用のテーブルや比較回路が不要な分だけ、回路の規模を小さくすることができる。
(変形例)
本発明は、上記の実施形態に限定されるものではなく、たとえば以下のような変形例も含む。
(1) エッジ検出
本発明の実施形態では、エッジ検出部4は、現在のフレームの画像を水平方向に走査して、閾値以上の画素が所定個数以上連続したセグメントが存在するときに、セグメントの両端の画素をエッジ画素として検出したが、これに限定するものではない。これに加えて、さらに、エッジ検出部4は、現在のフレームの画像を垂直方向に走査して、閾値以上の画素が所定個数以上連続したセグメントが存在するときに、セグメントの両端の画素もまたエッジ画素として検出するものとしてもよい。また、キャニー法、または輝度の2次微分を用いる方法などのような他の一般的なエッジ検出方法を用いることとしてもよい。
(2) 文字ラインの特定
本発明の実施形態では、文字ライン特定部7は、現在のフレームの画像を構成する水平方向の複数のラインのうち、頻度が閾値以上の動きベクトルと輝度の組合せを構成する輝度Aと同一の画素の数が閾値以上のラインを文字ラインとして特定したが、これに限定するものでない。文字ライン特定部7は、水平方向の複数ラインのうち、輝度Aとの差が所定値以下の輝度を有する画素の数が閾値以上のラインを文字ラインとして特定するものとしてもよい。
(3) 動き判定
本発明の実施形態では、動き判定部11は、特定した組合せを構成する動きベクトルの大きさが閾値TH4以下の場合に、特定した文字ラインに静止文字の画素が含まれると判定し、閾値TH4を超える場合に、文字ラインに動き文字の画素が含まれると判定した。ここで、閾値TH4は「0」であってもよい。
(4) 文字輪郭画素の特定
本発明の実施形態では、文字ライン特定部7は、現在のフレームの画像を構成する水平方向の複数のラインのうち、ヒストグラムの頻度が閾値以上の動きベクトルと輝度の組合せを構成する輝度Aと同一の画素の数が閾値以上のラインを文字ラインとして特定し、文字ライン上のエッジ画素を文字輪郭画素として特定し、文字輪郭画素と文字輪郭画素に挟まれる画素を文字画素として特定したが、これに限定するものでない。エッジ画素のうち、ヒストグラムの頻度が閾値以上となる動きベクトルと輝度の組合せを特定し、特定した動きベクトルと輝度とを有する画素を文字輪郭画素として特定し、文字輪郭画素と文字輪郭画素に挟まれる画素を文字画素として特定することとしてもよい。
(5) 文字画素の特定
本発明の実施形態では、文字画素特定部12は、1つの文字ラインを構成する複数の文字輪郭画素について、その1つの文字ラインの一端から順番にペアが構成できるときに、ペアを構成する2つの画素と、ペアを構成する2つの画素に挟まれる画素とを文字を構成する文字画素として特定したが、これに限定するものではない。たとえば、文字画素特定部12は、1つの文字ラインを構成する複数の画素のうち、その文字ラインを判定したときにカウントした輝度Aと同一の輝度を有する画素を文字画素として特定することとしてもよい。
(6) 文字輪郭強調
本発明の実施形態では、文字輪郭強調部9は、静止文字の文字輪郭画素の輝度をk1倍(k1>1)し、その文字輪郭画素の左右方向に隣接する画素の輝度をk2倍(k2<1)し、動き文字の文字輪郭画素の輝度をk3倍(k3>k1)し、その文字輪郭画素の左右方向に隣接する画素の輝度をk4倍(k4<k2)したが、これに限定するものではない。k1=k3、k2=k4であってもよい。また、上下方向に隣接する画素の輝度もk2倍またはk4倍することとしてもよいし、その他の輪郭を強調するためのフィルタを用いることとしてもよい。
(7) 代表ベクトル
本発明の実施形態では、動きベクトル補正部14は、1つの文字ラインの複数の文字画素の動きベクトルのうち、頻度が最も高い動きベクトルを代表ベクトルに設定したが、これに限定するものではない。たとえば、1つの文字ラインの複数の文字画素の動きベクトルの平均ベクトルを代表ベクトルに設定することとしてもよい。また、ヒストグラムにおける頻度が閾値以上となる動きベクトルと輝度の1つの組合せについて得られた複数の文字ライン(図3の「DEF」を構成するすべての文字ライン、あるいは「HT」を構成するすべての文字ライン)の複数の文字画素を動きベクトルの代表ベクトルを求めて、複数の文字ラインの複数の文字画素をすべてを代表ベクトルに補正するものとしてもよい。つまり、文字「DEF」を構成するすべての文字画素の代表ベクトルを求めて、これらの文字画素がすべて代表ベクトルになるようになるように補正し、文字「HT」を構成するすべての文字画素の代表ベクトルを求めて、これらの文字画素がすべて代表ベクトルになるようになるように補正する。これによっても、実施の形態と同様に、動きベクトルを用いて中間のフレームを作成する際に、動きベクトルがノイズを含んでいる場合に、補間後の中間のフレームの画像にノイズが生じるのを防止できる。また、この方法では、1つの文字ラインの文字画素の動きベクトルの大半がノイズを含んでいる場合でも、他の文字ラインの文字画素のノイズのない動きベクトルに補正することができる。
(8) フレーム補間
本発明の実施形態では、フレーム補間部10は、動きベクトルを用いて、前フレームの画像から前フレームと現フレームの中間のフレームの画像を生成することとしたが、これに限定するものではない。フレーム補間部10は、動きベクトルを用いて、現フレームの画像から中間のフレームの画像を生成してもよいし、動きベクトルを用いて、現フレームの画像および前フレームの画像の両方から中間のフレームの画像を生成してもよい。
(9) 超解像システム
本発明の実施形態の文字位置を検出する回路は、画像内の対象の種別ごとにレイヤに分離して、レイヤごとに画像処理するような超解像システムに適用することもできる。特に本発明の実施形態の文字位置を検出する回路を用いた場合、文字部分のレイヤ(文字列)を高精度に抽出できるため、文字に対する画像処理を効果的に実施することができる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 画像処理装置、2 フレームメモリ、3 メモリコントローラ、4 エッジ検出部、5 ヒストグラム生成部、6 文字位置検出部、7 文字ライン特定部、8 文字輪郭画素特定部、9 文字輪郭強調部、10 フレーム補間部、11 動き判定部、12 文字画素特定部、13 動きベクトル生成部、14 動きベクトル補正部、50 映像再生装置、51 入力部、52 入力合成部、53 映像処理部、54 出力部、55 表示装置。

Claims (14)

  1. 第1フレームの画像と、第2フレームの画像との動きベクトルを生成する動きベクトル生成部(13)と、
    前記第1フレームの画像のエッジを構成するエッジ画素を検出するエッジ検出部(4)と、
    前記第1フレームの画像の画素ごとの、動きベクトル、輝度、および前記エッジ画素が否かの情報に基づいて、前記第1フレームの画像に含まれる文字の位置を検出する文字位置検出部(6)とを備えた、画像処理装置(1)。
  2. 前記文字位置検出部(6)は、前記第1フレームの画像の動きベクトルと前記輝度の組み合わせごとの、前記組合せを構成する動きベクトルと輝度とを有する画素がエッジ画素である頻度に基づいて、前記文字の位置を検出する、請求の範囲第1項に記載の画像処理装置(1)。
  3. 前記文字位置検出部(6)は、
    前記動きベクトルと前記輝度の組み合わせごとに、前記組合せの動きベクトルと輝度とを有する画素がエッジ画素である頻度を表わすヒストグラムを生成するヒストグラム生成部(5)と、
    前記頻度が所定値以上となる動きベクトルと輝度の組合せを特定し、前記第1フレームの画像を構成する水平方向の複数のラインのうち、前記特定した組合せを構成する輝度との差が所定値以下の輝度を有する画素の数が所定個数以上のラインを文字の画素が含まれる文字ラインとして特定する文字ライン特定部(7)とを含む、請求の範囲第2項に記載の画像処理装置(1)。
  4. 前記文字位置検出部(6)は、さらに、
    前記頻度が所定値以上となる組合せを構成する動きベクトルの大きさが所定値以下の場合に、前記文字ラインに前記第1フレームと前記第2フレームにおいて位置が変化しない静止文字の画素が含まれると判定し、前記所定値を超える場合に、前記文字ラインに前記第1フレームと前記第2フレームにおいて位置が変化した動き文字の画素が含まれると判定する動き判定部(11)を含む、請求項の範囲第3項に記載の画像処理装置(1)。
  5. 前記文字位置検出部(6)は、さらに、
    前記文字ラインに含まれる複数の画素のうち、前記エッジ画素である画素を文字の輪郭を構成する文字輪郭画素として特定する文字輪郭画素特定部(8)を含む、請求の範囲第3項に記載の画像処理装置(1)。
  6. 前記文字位置検出部(6)は、さらに、
    1つの文字ラインに含まれる複数の文字輪郭画素について、前記1つの文字ラインの一端から順番にペアが構成できるときに、前記ペアを構成する2つの画素と、前記ペアを構成する2つの画素の間に挟まれる画素とを文字を構成する文字画素として特定する文字画素特定部(12)を含む、請求の範囲第5項に記載の画像処理装置(1)。
  7. 前記画像処理装置(1)は、さらに、
    1つの文字ラインに含まれる複数の文字画素の動きベクトルを代表する代表ベクトルを特定し、前記1つの文字ラインに含まれる複数の文字画素の動きベクトルのうち、前記代表ベクトルと同一でないものについては、前記代表ベクトルに補正する動きベクトル補正部(14)を備えた請求の範囲第6項に記載の画像処理装置(1)。
  8. 前記画像処理装置(1)は、さらに、
    前記頻度が所定値以上となる動きベクトルと輝度の1つの組合せについて、前記特定された複数の文字ラインに含まれる複数の文字画素の動きベクトルを代表する代表ベクトルを特定し、前記複数の文字ラインに含まれる複数の文字画素の動きベクトルのうち、前記代表ベクトルと同一でないものについては、前記代表ベクトルに補正する動きベクトル補正部(14)を備えた請求の範囲第6項に記載の画像処理装置(1)。
  9. 前記画像処理装置(1)は、さらに、
    前記補正された動きベクトルを用いて、前記第1フレームの画像と前記第2フレームの画像の少なくとも一方から、前記第1フレームと前記第2フレームとの間の補間フレームを生成するフレーム補間部(10)を備えた、請求の範囲第7項または第8項に記載の画像処理装置(1)。
  10. 前記画像処理装置(1)は、さらに、
    前記文字輪郭画素を強調処理する文字輪郭強調部(9)を備えた、請求の範囲第5項に記載の画像処理装置(1)。
  11. 前記文字位置検出部(6)は、さらに、
    前記頻度が所定値以上となる組合せを構成する動きベクトルの大きさが所定値以下の場合に、前記文字ラインに前記第1フレームと前記第2フレームにおいて位置が変化しない静止文字の画素が含まれると判定し、前記所定値を超える場合に、前記文字ラインに前記第1フレームと前記第2フレームにおいて位置が変化した動き文字の画素が含まれると判定する動き判定部(11)を含み、
    前記文字輪郭強調部(9)は、前記静止文字が含まれると判定された文字ラインに含まれる文字輪郭画素については、第1の強度で強調し、前記動き文字が含まれると判定された文字ラインに含まれる文字輪郭画素については、前記第1の強度よりも強い第2の強度で強調する、請求の範囲第10項に記載の画像処理装置(1)。
  12. 前記エッジ検出部(4)は、前記第1フレームの画像を水平方向に走査して、所定値以上の画素が所定個数以上連続したセグメントが存在するときに、前記セグメントの両端を前記エッジ画素として検出する、請求の範囲第1項に記載の画像処理装置(1)。
  13. 外部から映像データを入力し、デコード処理を行う入力部(51)と、
    前記映像データにおけるデータを、表示画面に対応する1つのまとまりの映像データへ合成する合成部(52)と、
    前記映像データに対し、所定の画像処理を行う画像処理部(53)と、
    前記画像処理を適用した後の前記映像データを、表示装置へ出力して表示させる出力部(54)とを備え、
    前記画像処理部(53)は、前記請求項1から12のいずれか1項に記載の画像処理装置(1)を含む、映像再生装置(50)。
  14. 前記画像処理部(53)は、さらに、前記画像処理装置(1)の検出情報に基づいて、文字領域内のノイズ除去動作を行うノイズ除去部(9)を有する、請求の範囲第13項に記載の映像再生装置(50)。
JP2011529716A 2009-09-02 2009-09-02 画像処理装置および映像再生装置 Expired - Fee Related JP5377649B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/065292 WO2011027422A1 (ja) 2009-09-02 2009-09-02 画像処理装置および映像再生装置

Publications (2)

Publication Number Publication Date
JPWO2011027422A1 true JPWO2011027422A1 (ja) 2013-01-31
JP5377649B2 JP5377649B2 (ja) 2013-12-25

Family

ID=43648984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011529716A Expired - Fee Related JP5377649B2 (ja) 2009-09-02 2009-09-02 画像処理装置および映像再生装置

Country Status (3)

Country Link
US (1) US20120106648A1 (ja)
JP (1) JP5377649B2 (ja)
WO (1) WO2011027422A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4937382B2 (ja) * 2010-06-30 2012-05-23 株式会社東芝 映像信号補間装置、映像表示装置及び映像信号補間方法
JPWO2022102337A1 (ja) * 2020-11-10 2022-05-19
CN112927181B (zh) * 2020-11-18 2022-11-18 珠海市杰理科技股份有限公司 图像亮度调节方法及装置、图像采集设备、存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2116600C (en) * 1993-04-10 1996-11-05 David Jack Ittner Methods and apparatus for inferring orientation of lines of text
JPH08194780A (ja) * 1994-11-18 1996-07-30 Ricoh Co Ltd 特徴抽出方法
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
US7031522B2 (en) * 2000-06-23 2006-04-18 Sony Corporation Image processing apparatus and method, and storage medium therefor
DE60229632D1 (de) * 2001-05-15 2008-12-11 Koninkl Philips Electronics Nv Untertitelerkennung in anzeigbaren Bildbereich eines Videosignals
TWI245557B (en) * 2003-09-11 2005-12-11 Matsushita Electric Ind Co Ltd Image compensation apparatus and method for the same
JP4700002B2 (ja) * 2004-08-19 2011-06-15 パイオニア株式会社 テロップ検出方法、テロップ検出プログラム、およびテロップ検出装置
JP4157579B2 (ja) * 2006-09-28 2008-10-01 シャープ株式会社 画像表示装置及び方法、画像処理装置及び方法
JP4412323B2 (ja) * 2006-12-28 2010-02-10 株式会社日立製作所 映像処理装置及び映像表示装置
JP4861845B2 (ja) * 2007-02-05 2012-01-25 富士通株式会社 テロップ文字抽出プログラム、記録媒体、方法及び装置
JP4659793B2 (ja) * 2007-08-07 2011-03-30 キヤノン株式会社 画像処理装置及び画像処理方法
JP5115151B2 (ja) * 2007-11-02 2013-01-09 ソニー株式会社 情報提示装置及び情報提示方法

Also Published As

Publication number Publication date
US20120106648A1 (en) 2012-05-03
JP5377649B2 (ja) 2013-12-25
WO2011027422A1 (ja) 2011-03-10
WO2011027422A9 (ja) 2012-01-12

Similar Documents

Publication Publication Date Title
US8144255B2 (en) Still subtitle detection apparatus and image processing method therefor
JP4525692B2 (ja) 画像処理装置、画像処理方法、画像表示装置
JP3898606B2 (ja) 動きベクトル検出方法及び装置並びにフレーム補間画像作成方法及び装置
US9262684B2 (en) Methods of image fusion for image stabilization
JP4412323B2 (ja) 映像処理装置及び映像表示装置
US20020080882A1 (en) Noise reducing apparatus and noise reducing method
JP2008160591A (ja) テレビジョン受信機及びそのフレームレート変換方法
US8411974B2 (en) Image processing apparatus, method, and program for detecting still-zone area
JP2008187222A (ja) 動きベクトル検出装置、動きベクトル検出方法、映像表示装置
US8830257B2 (en) Image displaying apparatus
US20060274094A1 (en) Composite method and apparatus for adjusting image resolution
JP2011154342A (ja) 画像処理装置及び画像処理方法
US9215353B2 (en) Image processing device, image processing method, image display device, and image display method
JP4659793B2 (ja) 画像処理装置及び画像処理方法
JP5377649B2 (ja) 画像処理装置および映像再生装置
AU2004200237B2 (en) Image processing apparatus with frame-rate conversion and method thereof
JP2007087218A (ja) 画像処理装置
JP5164716B2 (ja) 映像処理装置および映像表示装置
US20130201404A1 (en) Image processing method
JP2010009305A (ja) 画像処理装置、画像処理方法及びプログラム
EP2509045B1 (en) Method of, and apparatus for, detecting image boundaries in video data
JP2011082932A (ja) テロップ画像検出方法およびテロップ画像検出装置
JP2010169822A (ja) 画像出力装置及び画像出力方法
JP2010263539A (ja) 画像品質評価方法、プログラム、及び、画像品質評価装置
JP2006279982A (ja) 動きベクトル検出方法、フレーム補間画像作成方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees