JP4861845B2 - テロップ文字抽出プログラム、記録媒体、方法及び装置 - Google Patents
テロップ文字抽出プログラム、記録媒体、方法及び装置 Download PDFInfo
- Publication number
- JP4861845B2 JP4861845B2 JP2007025259A JP2007025259A JP4861845B2 JP 4861845 B2 JP4861845 B2 JP 4861845B2 JP 2007025259 A JP2007025259 A JP 2007025259A JP 2007025259 A JP2007025259 A JP 2007025259A JP 4861845 B2 JP4861845 B2 JP 4861845B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- telop
- luminance
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Description
本発明はテロップ文字抽出プログラムを提供する。本発明のテロップ文字抽出プログラムは、コンピュータに、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させることを特徴とする。
グレースケール画像からエッジを抽出したエッジ画像を生成し、
エッジ画像を2値化してエッジ2値画像を生成し、
エッジ2値画像のエッジ画素を膨張させてエッジ領域画像を生成する。
輝度ヒストグラムの輝度軸上に1又は複数の閾値を設定して分割した輝度クラスもつ複数種類の輝度ヒストグラムを生成し、
複数種類の輝度ヒストグラムについて、閾値上のヒストグラム値の平均値を比較し、平均値が最小となる輝度ヒストグラムを選択する。
輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラム生成し、
輝度クラスを2分割した第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択する。
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
2値ラベル画像に含まれる文字パターンの中からテロップ領域画像の外周に接している文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値ラベル画像をテロップ文字候補画像として選択する。
テロップ文字画像と原画であるテロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
テロップ文字候補画像から最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成する。
文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
カウントが最大となる小立方体に属する色を最大頻度色として抽出する。
テロップ文字画像と原画であるテロップ領域画像との論理積をとって文字色画像を生成し、
文字色画像から全体平均色を求めると共に、2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
ノイズ判定値が所定の閾値より大きな文字パターンをノイズとしてテロップ文字候補画像から除去してテロップ文字画像を生成する。
本発明は、ロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体を提供する。本発明の記録媒体は、コンピュータに、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を多値化して複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラムを格納したことを特徴とする。
本発明はテロップ文字抽出方法を提供する。本発明のテロップ文字抽出方法は、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成ステップと、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去ステップと、
を備えたことを特徴とする。
本発明はテロップ文字抽出装置を提供する。本発明のテロップ文字抽出装置は、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を備えたことを特徴とする。
G=r*0.299+g*0.587+b:0.114 (1)
(h3L+h3R)/2
を算出する。
(r_mean,g_mean,b_mean)
とする。
value= │r_mean−r1│*count+
│g_mean−g1│*count+
│b_mean−b1│*count
ここで本発明の特徴をまとめて列挙すると次の付記のようになる。
(付記)
(付記1)(プログラム)
コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラム。(1)
付記1記載のテロップ文字抽出プログラムに於いて、前記エッジ領域抽出部は、
前記グレースケール画像からエッジを抽出したエッジ画像を生成し、
前記エッジ画像を2値化してエッジ2値画像を生成し、
前記エッジ2値画像のエッジ画素を膨張させて前記エッジ領域画像を生成することを特徴とするテロップ文字抽出プログラム。
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度ヒストグラム作成部は、前記輝度ヒストグラムを作成した後に、各輝度のヒストグラム値として、隣接する複数の輝度のヒストグラム値との移動平均値を算出して平滑化することを特徴とするテロップ文字抽出プログラム。
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
前記輝度ヒストグラムの輝度軸上に1又は複数の閾値を設定して分割した輝度クラスもつ複数種類の輝度ヒストグラムを生成し、
前記複数種類の輝度ヒストグラムについて、前記閾値上のヒストグラム値の平均値を比較し、平均値が最小となる輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラムを生成し、
輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。(2)
付記1記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。(3)
付記6記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、前記クラス毎に求めた2値画像の面積に大きな差がない場合、各クラスの2値ラベル画像毎に線密度を算出し、前記線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。
付記7記載のテロップ文字抽出プログラムに於いて、前記線密度は、前記2値画像の行毎に背景画素から文字画素への変化点の数を求めた総和を、前記2値画像の行数で割った値であることを特徴とするテロップ文字抽出プログラム。
付記1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ字領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
前記最大頻度色の抽出は、
前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出プログラム。(4)
付記1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズと判定して前記テロップ文字候補画像から除去したテロップ文字画像を生成することを特徴とするテロップ文字抽出プログラム。(5)
コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体。(6)
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
前記輝度ヒストグラムの輝度を輝度クラスに分割する輝度クラス生成ステップと、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去ステップと、
を備えたことを特徴とするテロップ文字抽出方法。(7)
付記12記載のテロップ文字抽出方法に於いて、前記エッジ領域抽出ステップは、
前記グレースケール画像からエッジを抽出したエッジ画像を生成し、
前記エッジ画像を2値化してエッジ2値画像を生成し、
前記エッジ2値画像のエッジ画素を膨張させて前記エッジ領域画像を生成することを特徴とするテロップ文字抽出方法。
付記12記載のテロップ文字抽出方法に於いて、前記輝度ヒストグラム作成ステップは、
前記輝度ヒストグラムを作成した後に、各輝度のヒストグラム値として、隣接する複数の輝度のヒストグラム値との平均値を算出して平滑化することを特徴とするテロップ文字抽出方法。
付記12記載のテロップ文字抽出方法に於いて、前記輝度クラス生成ステップは、
前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラム生成し、
輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出方法。
付記12記載のテロップ文字抽出方法に於いて、前記文字パターン候補選択ステップは、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出方法。
付記12記載のテロップ文字抽出方法に於いて、前記文字パターン候補選択ステップは、前記クラス毎に求めた2値画像の面積に大きな差がない場合、各クラスの2値画像毎に線密度を算出し、前記線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出方法。
付記12記載のテロップ文字抽出方法に於いて、前記ノイズ除去ステップは、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
前記最大頻度色の抽出は、
前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出方法。
付記1記載のテロップ文字抽出方法に於いて、前記ノイズ除去ステップは、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズとして前記テロップ文字候補画像から除去してテロップ文字画像を生成することを特徴とするテロップ文字抽出方法。
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を備えたことを特徴とするテロップ文字抽出装置。(8)
12:映像ファイル
14:記憶部
16:画像入力部
18:グレースケール画像生成部
20:エッジ領域抽出部
22:輝度ヒストグラム作成部
24:輝度クラス生成部
26:文字パターン候補選択部
28:ノイズ除去部
30:テロップ文字出力部
32:テロップ領域画像
34:グレースケール画像
36:エッジ領域画像
38:輝度ヒストグラム
40:輝度クラス別2値画像
42:テロップ文字候補画像
44:テロップ文字画像
46:文字認識部
48:CPU
50:バス
52:RAM
54:ROM
56:ハードディスクドライブ
58:デバイスインタフェース
60:キーボード
62:マウス
64:ディスプレイ
66:ネットワークアダプタ
68,108:テロップ領域画像
70,110:グレースケール画像
72,112:エッジ2値画像
74,114:膨張画像
76,78:輝度ヒストグラム曲線
80:平滑化前輝度値
82:平滑化後輝度値
84−1,86−1:低輝度クラス
84−2,86−3:高輝度クラス
86−2:中輝度クラス
90−1〜90−3,116−1〜116−3:2値画像
92−1〜92−3,118−1〜118−3:2値ラベル画像
94−1〜94−3,120−1〜120−3:ノイズ除去2値画像
96−1〜96−8:文字パターン
98−1,98−2,98−8:ラベルパターン
100,122:原画増
102,124:論理積
104,126:文字色画像
105,127:ノイズ
106,128:テロップ文字画像
Claims (8)
- コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラム。
- 請求項1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラムを生成し、
輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。
- 請求項1記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。
- 請求項1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
前記最大頻度色の抽出は、
前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出プログラム。
- 請求項1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
前記輝度クラス毎に各クラスに属する輝度の画素を集めた2値画像を生成すると共に連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズと判定して前記テロップ文字候補画像から除去したテロップ文字画像を生成することを特徴とするテロップ文字抽出プログラム。
- コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体。
- カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
前記輝度ヒストグラムの輝度を輝度クラスに分割する輝度クラス生成ステップと、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去ステップと、
を備えたことを特徴とするテロップ文字抽出方法。
- カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
を備えたことを特徴とするテロップ文字抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007025259A JP4861845B2 (ja) | 2007-02-05 | 2007-02-05 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
US12/021,611 US7961948B2 (en) | 2007-02-05 | 2008-01-29 | Computer-readable record medium in which a telop character extraction program is recorded, telop character extraction method and telop character extraction apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007025259A JP4861845B2 (ja) | 2007-02-05 | 2007-02-05 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008191906A JP2008191906A (ja) | 2008-08-21 |
JP4861845B2 true JP4861845B2 (ja) | 2012-01-25 |
Family
ID=39676227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007025259A Active JP4861845B2 (ja) | 2007-02-05 | 2007-02-05 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7961948B2 (ja) |
JP (1) | JP4861845B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4667381B2 (ja) * | 2004-07-20 | 2011-04-13 | パナソニック株式会社 | 映像処理装置およびその方法 |
EP2064658A4 (en) * | 2006-09-07 | 2017-08-23 | Lumex As | Relative threshold and use of edges in optical character recognition process |
US20080174607A1 (en) * | 2007-01-24 | 2008-07-24 | Ali Iranli | Systems and methods for reducing power consumption in a device through a content adaptive display |
JP4861845B2 (ja) * | 2007-02-05 | 2012-01-25 | 富士通株式会社 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
JP5090330B2 (ja) * | 2008-12-26 | 2012-12-05 | Kddi株式会社 | 画像処理装置、画像処理方法およびプログラム |
JP2010245853A (ja) * | 2009-04-07 | 2010-10-28 | Hitachi Ltd | 動画インデクシング方法及び動画再生装置 |
JP5377649B2 (ja) * | 2009-09-02 | 2013-12-25 | ルネサスエレクトロニクス株式会社 | 画像処理装置および映像再生装置 |
CN102511048B (zh) * | 2009-12-31 | 2015-08-26 | 塔塔咨询服务有限公司 | 一种用于预处理包括文本的视频区域的方法及系统 |
JP2012003480A (ja) * | 2010-06-16 | 2012-01-05 | Nippon Hoso Kyokai <Nhk> | テロップ文字領域検出装置、及びプログラム |
JP5500480B2 (ja) * | 2010-06-24 | 2014-05-21 | 株式会社日立情報通信エンジニアリング | 帳票認識装置及び帳票認識方法 |
CN103034854B (zh) * | 2011-09-30 | 2016-03-30 | 富士通株式会社 | 图像处理装置和方法 |
US8818030B2 (en) * | 2011-12-13 | 2014-08-26 | Xerox Corporation | Post-processing a multi-spectral image for enhanced object identification |
US8831381B2 (en) * | 2012-01-26 | 2014-09-09 | Qualcomm Incorporated | Detecting and correcting skew in regions of text in natural images |
US9064191B2 (en) | 2012-01-26 | 2015-06-23 | Qualcomm Incorporated | Lower modifier detection and extraction from devanagari text images to improve OCR performance |
JP5964078B2 (ja) * | 2012-02-28 | 2016-08-03 | 学校法人東京電機大学 | 文字認識装置、文字認識方法およびプログラム |
JP5547226B2 (ja) * | 2012-03-16 | 2014-07-09 | 株式会社東芝 | 画像処理装置、及び画像処理方法 |
JP5974589B2 (ja) * | 2012-03-30 | 2016-08-23 | ブラザー工業株式会社 | 画像処理装置およびプログラム |
JP5958023B2 (ja) * | 2012-03-30 | 2016-07-27 | ブラザー工業株式会社 | 画像処理装置および画像処理プログラム |
US9076242B2 (en) | 2012-07-19 | 2015-07-07 | Qualcomm Incorporated | Automatic correction of skew in natural images and video |
US9047540B2 (en) | 2012-07-19 | 2015-06-02 | Qualcomm Incorporated | Trellis based word decoder with reverse pass |
US9141874B2 (en) | 2012-07-19 | 2015-09-22 | Qualcomm Incorporated | Feature extraction and use with a probability density function (PDF) divergence metric |
US9183458B2 (en) | 2012-07-19 | 2015-11-10 | Qualcomm Incorporated | Parameter selection and coarse localization of interest regions for MSER processing |
US9262699B2 (en) | 2012-07-19 | 2016-02-16 | Qualcomm Incorporated | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR |
JP6092024B2 (ja) * | 2013-07-03 | 2017-03-08 | 日本電信電話株式会社 | 文字認識装置、方法、及びプログラム |
CN104766076B (zh) * | 2015-02-28 | 2019-01-01 | 北京奇艺世纪科技有限公司 | 一种视频图像文字的检测方法和装置 |
JP2018534703A (ja) * | 2015-09-10 | 2018-11-22 | エスワイエヌシー−アールエックス、リミテッド | 自動画像特徴除去 |
CN105913065B (zh) * | 2016-04-12 | 2019-06-11 | 中国科学院遥感与数字地球研究所 | 一种图像目标区域提取的方法及系统 |
CN108961260B (zh) * | 2017-05-26 | 2021-08-24 | 创新先进技术有限公司 | 图像二值化方法及装置、计算机存储介质 |
WO2019026392A1 (ja) * | 2017-07-31 | 2019-02-07 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN108847252B (zh) * | 2018-04-26 | 2022-12-02 | 杭州电子科技大学 | 基于声信号语谱图纹理分布的声特征提取方法 |
CN110717922A (zh) * | 2018-07-11 | 2020-01-21 | 普天信息技术有限公司 | 一种图像清晰度评价方法及装置 |
KR102573562B1 (ko) * | 2019-02-19 | 2023-09-04 | 삼성전자주식회사 | 디텐트 구조물이 배치된 힌지 모듈 및 이를 포함하는 접이식 전자 장치 |
EP3894984B1 (en) * | 2019-02-19 | 2023-06-28 | Samsung Electronics Co., Ltd. | Hinge module including detent structure and foldable electronic device including the hinge module |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3230368B2 (ja) * | 1994-02-28 | 2001-11-19 | 新日鉄ソリューションズ株式会社 | 二値化処理方法 |
US6226402B1 (en) * | 1996-12-20 | 2001-05-01 | Fujitsu Limited | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof |
FI104521B (fi) * | 1997-01-30 | 2000-02-15 | Nokia Multimedia Network Termi | Menetelmä kuvasekvenssien kontrastin parantamiseksi |
US6366699B1 (en) * | 1997-12-04 | 2002-04-02 | Nippon Telegraph And Telephone Corporation | Scheme for extractions and recognitions of telop characters from video data |
JP3655110B2 (ja) * | 1998-12-15 | 2005-06-02 | 株式会社東芝 | 映像処理方法及び装置並びに映像処理手順を記録した記録媒体 |
JP3692018B2 (ja) * | 2000-01-24 | 2005-09-07 | 株式会社東芝 | テロップ情報処理装置 |
JP2004252748A (ja) * | 2003-02-20 | 2004-09-09 | Toshiba Corp | 画像処理方法、画像処理装置 |
JP4048996B2 (ja) * | 2003-04-11 | 2008-02-20 | ソニー株式会社 | テロップの抽出装置および抽出方法、並びにプログラムおよび媒体 |
JP2004364234A (ja) * | 2003-05-15 | 2004-12-24 | Pioneer Electronic Corp | 放送番組内容メニュー作成装置及び方法 |
JP4861845B2 (ja) * | 2007-02-05 | 2012-01-25 | 富士通株式会社 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
-
2007
- 2007-02-05 JP JP2007025259A patent/JP4861845B2/ja active Active
-
2008
- 2008-01-29 US US12/021,611 patent/US7961948B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080187225A1 (en) | 2008-08-07 |
US7961948B2 (en) | 2011-06-14 |
JP2008191906A (ja) | 2008-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4861845B2 (ja) | テロップ文字抽出プログラム、記録媒体、方法及び装置 | |
US11922615B2 (en) | Information processing device, information processing method, and storage medium | |
CN110678901B (zh) | 信息处理设备、信息处理方法和计算机可读存储介质 | |
KR20010110416A (ko) | 비디오 스트림 분류가능 심볼 고립 방법 및 시스템 | |
JP2005339547A (ja) | 画像の文字抽出装置、画像の文字抽出方法及びこの画像の文字抽出方法を実現するためのコンピュータ可読コードを記録した媒体 | |
JP5786495B2 (ja) | 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム | |
JP2007174654A (ja) | 文書画像を示す走査データを処理するための方法 | |
CN108805116A (zh) | 图像文本检测方法及其系统 | |
Shi et al. | Adaptive graph cut based binarization of video text images | |
JP4926266B2 (ja) | 学習データ作成装置、学習データ作成方法及びプログラム | |
JP2007048006A (ja) | 画像処理装置および画像処理プログラム | |
JP4164489B2 (ja) | 文書画像強調方法、装置及びそのための記憶媒体 | |
US9064179B2 (en) | Region extraction apparatus, region extraction method, and computer program product | |
Zhang et al. | A novel approach for binarization of overlay text | |
CN116977931A (zh) | 一种基于深度学习的高空抛物识别方法 | |
Felhi et al. | Multiscale stroke-based page segmentation approach | |
Huang | A novel video text extraction approach based on Log-Gabor filters | |
JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
Manisha et al. | Text frame classification and recognition using segmentation technique | |
JP4943501B2 (ja) | 画像処理装置及び方法、並びに、光学式の文字識別装置及び方法 | |
KR100499121B1 (ko) | 자동 문턱치화 기술을 이용한 영상분할 장치 및 그 방법 | |
Awoke et al. | Ethiopic and latin multilingual text detection from images using hybrid techniques | |
Tribuzy et al. | Vehicle License Plate Preprocessing Techniques Using Graphical Interface | |
CN108573258B (zh) | 一种快速的复杂背景图像中维语文字定位方法 | |
JP2005083843A (ja) | 欠陥検出装置、クラスタ生成装置、欠陥分類装置、欠陥検出方法、クラスタ生成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091016 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111011 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4861845 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |