JP3435334B2 - 映像中文字領域抽出装置および方法および記録媒体 - Google Patents

映像中文字領域抽出装置および方法および記録媒体

Info

Publication number
JP3435334B2
JP3435334B2 JP03947198A JP3947198A JP3435334B2 JP 3435334 B2 JP3435334 B2 JP 3435334B2 JP 03947198 A JP03947198 A JP 03947198A JP 3947198 A JP3947198 A JP 3947198A JP 3435334 B2 JP3435334 B2 JP 3435334B2
Authority
JP
Japan
Prior art keywords
value
image
area
horizontal line
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03947198A
Other languages
English (en)
Other versions
JPH11239363A (ja
Inventor
秀豪 桑野
啓之 新井
正治 倉掛
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03947198A priority Critical patent/JP3435334B2/ja
Priority to US09/204,957 priority patent/US6366699B1/en
Publication of JPH11239363A publication Critical patent/JPH11239363A/ja
Priority to US09/967,431 priority patent/US6501856B2/en
Application granted granted Critical
Publication of JP3435334B2 publication Critical patent/JP3435334B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Color Television Systems (AREA)
  • Processing Of Color Television Signals (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばテレビ放送
の映像等のカラー動画像を構成する複数のフレームにお
いて、テロップ文字等の文字が表示されているフレーム
画像の中から文字部分を画素連結領域として抽出する文
字領域抽出技術に関するものである。
【0002】
【従来の技術】カラー動画像を構成する複数のフレーム
の中の文字が表示されているフレーム画像、あるいは文
字が表示されている静止カラー画像に関して、少ない計
算量で安定的に文字部分を画素連結領域として抽出する
文字領域抽出技術に関しては、従来から多くの研究が行
われている。それらの中で、参考文献1「H.Kuwa
no,S.Kurakake,K.Odaka,”Te
lop Character Extraction
from Video Data”,Proc. of
IEEE International Works
hop on Document Image Ana
lysis, pp.82−88(1997−06)」
で提案されている文字領域抽出法がある。
【0003】この方法は、文字が表示されている入力カ
ラー画像に対して、画像の中の輝度、彩度、色相の順で
1次元色空間の分割を行うことで、輝度、彩度、色相が
類似し、画像空間内で隣接する画素連結領域の形成を行
い、次に形成した領域のうち、文字領域特徴を満たさな
い領域を除去するという方法をとっている。
【0004】従来手法において、輝度空間の分割処理
は、画像中の局所的な矩形領域内での輝度空間に対し、
該矩形領域内で求めた閾値を用いて分割するため、画像
内の局所的な輝度変動がある場合でも良好な文字領域抽
出結果が得られるという特徴がある。
【0005】
【発明が解決しようとする課題】しかしながら、前記の
従来手法においては、入力される文字表示カラー画像が
テレビ放送などで使用されているNTSC信号形式の映
像中の画像の場合、色劣化した文字の色劣化部が途切れ
た文字領域が抽出されてしまう問題点がある。
【0006】通常、NTSC信号形式の動画像には、画
像内の各走査線に沿って各画素の色が滲み、画像内の文
字については背景との左右の境界部で背景部の色が文字
内部に滲んで、本来の色が劣化してしまうという特徴が
ある。色劣化は、文字内の横成分に関しては左右の端の
み起こり、中心部は影響を受けず、縦成分に関しては文
字幅が狭いために全体が劣化して輝度が低下し、文字内
の横成分と縦成分の輝度コントラストが高くなる場合が
ある(図12、図13参照)。このため、前記の従来手
法において、NTSC信号形式の動画像中の色が劣化し
た文字の横成分と縦成分の接続部を含むような矩形領域
内で閾値を決定すると色劣化した縦成分が背景としてみ
なされてしまい、結果として文字領域が途切れて抽出さ
れてしまう(図14参照)。
【0007】図12は、NTSC形式の映像中に表示さ
れる文字内に生じる色劣化の一例を示した図である。黒
い背景が白い「音響エコーキャンセラ、Acousti
c Echo Canceller」という文字の内部
に滲み、文字内の縦成分が灰色に劣化している。
【0008】図13は、文字内色劣化の模式図であり、
黒い背景中の白い文字「t」というテロップ文字の内部
に黒い背景色が滲み、文字内部の色が部分的に灰色に変
色する色劣化の模式図である。文字内の横成分に関して
は左右の端のみ色劣化を起こし、中心部は影響を受けな
い(図13中領域A)。縦成分に関しては文字幅が狭い
ために全体が劣化して輝度が低下し(図13中領域
B)、文字内の横成分と縦成分の輝度コントラストが大
きくなる。このような場合、従来の二値化法[参考文献
1]によると、領域Bが背景とみなされる場合があっ
た。
【0009】図14は、従来手法[参考文献1]で図1
2のカラー画像から文字領域を抽出した結果であり、各
文字の色劣化部が途切れた結果となる。
【0010】また、通常、画像中に表示されるテロップ
文字等の文字は、周囲の部分との色のコントラストが非
常に高いという特徴を持つ。前記の従来手法では、画素
連結領域の形成を色空間の分割処理のみで行い、画像空
間内の色分布の特徴を考慮していないため、周囲の部分
との色のコントラストが低い連結画素領域も抽出してし
まい、文字以外の領域を多数抽出してしまうという問題
点もある。
【0011】そこで本発明は、画像中から文字領域を抽
出する際に、高輝度文字内の色劣化部を抽出でき、周囲
とのコントラストが低い領域の抽出を抑制できる画像中
文字領域抽出装置および方法を提供することを課題とす
る。
【0012】前記の課題を解決するために、本発明によ
る映像中文字領域抽出装置は、カラー動画像中の複数の
フレーム画像の中から予め決められた方法を用いて文字
が表示されているフレーム画像と、該フレーム画像より
も後の時刻のフレーム画像のうち該フレーム画像中の文
字と同一の文字が表示されているカラー画像を複数枚入
力して記憶する第1の手段と、第1の手段により入力さ
れた複数の画像間で位置の対応する画素同士の輝度、彩
度、色相それぞれの平均値を各画素の値として持つ平均
値カラー画像を作成する第2の手段と、第2の手段によ
り得られた平均値カラー画像に対して、輝度値が類似
し、画像空間内で隣接する複数の画素同士を連結領域と
して形成する第3の手段と、第3の手段により得られた
輝度値が類似する連結領域画像に対し、各領域内で彩度
値が類似し、画像空間内で隣接する複数の画素同士を連
結領域として形成する第4の手段と、第4の手段により
得られた輝度値、彩度値共に類似する連結領域画像に対
し、各領域内で色相値が類似し、画素空間内で隣接する
複数の画素を連結領域として形成する第5の手段と、第
5の手段により得られた輝度値、彩度値、色相値共に類
似する画像中の連結領域に対し、文字領域特徴を満たさ
ない連結領域を除去する第6の手段と、第6の手段によ
り得られた連結領域画像を文字領域抽出結果として蓄積
する第7の手段と、第1〜第7の手段の実行順序を制御
する第8の手段と、を有する映像中文字領域抽出装置に
おいて、第3の手段を、画像中の各水平ライン内の輝度
分布中で輝度の極大値をとる画素付近で局所的に輝度値
が高い範囲を全て抽出し、抽出された高輝度範囲とその
他の範囲とで水平ラインの第一の二値化を行い、また、
各水平ライン内の輝度分布中で輝度の極小値をとる画素
付近で局所的に輝度値が低い範囲を全て抽出し、抽出さ
れた低輝度範囲とその他の範囲とで水平ラインの第二の
二値化を行い、各水平ライン毎の第一の二値化結果を統
合することにより仮の高輝度文字領域を抽出し、各水平
ライン毎の第二の二値化結果を統合することにより仮の
低輝度文字領域を抽出する第9の手段と、第9の手段に
より得られた仮の高輝度文字領域画像中の各領域毎に、
通し番号をラベルとして付与し、また、第9の手段によ
り得られた仮の低輝度文字領域画像中の各領域毎に通し
番号をラベルとして付与するラベリング処理を行う第1
0の手段と、第10の手段によ り得られたラベル画像中
の同一ラベルが付与された個々の仮の高輝度文字領域内
で、及び個々の仮の低輝度文字領域内で垂直方向の輝度
分布を二値化することで仮の高輝度文字領域中の高輝度
文字領域画素、及び個々の仮の低輝度文字領域中の低輝
度文字領域画素を確定する第11の手段と、第9〜第1
1の手段の実行順序を制御する第12の手段と、を用い
て実現することを特徴とする。
【0013】
【0014】また、前記の第9の手段を、画像中のある
水平ライン内の輝度分布において、輝度の極大値を持つ
画素を全て求め、求めた各極大値画素を開始点とし、該
水平ライン上を一画素ずつ左右に走査し、開始点の極大
値画素の左右両側でそれぞれ開始点の輝度値よりも予め
設定した閾値だけ輝度値が低い最初の画素を検出し、検
出された左右2つの画素と該水平ライン上でそれら2つ
の画素の間に存在する複数の画素を連結画素領域として
抽出する第13の手段と、画像中のある水平ライン上
で、第13の手段により得られた連結画素領域の左右の
両端における水平方向の輝度勾配の絶対値が左右の両端
とも予め設定した値よりも大きい連結画素領域だけを抽
出し、得られた各水平ライン上の連結画素領域が画像全
体で統合されるものを仮の高輝度文字領域とする第14
の手段と、画像中のある水平ライン内の輝度分布におい
て、輝度の極小値を持つ画素を全て求め、求めた各極小
値画素を開始点とし、該水平ライン上を一画素ずつ左右
に走査し、開始点の極小値画素の左右両側でそれぞれ開
始点の輝度値よりも予め設定した閾値だけ輝度値が高い
最初の画素を検出し、検出された左右2つの画素と該水
平ライン上でそれら2つの画素の間に存在する複数の画
を連結画素領域として抽出する第15の手段と、画像
中のある水平ライン上で、第15の手段により得られた
連結画素領域の左右の両端における水平方向の輝度勾配
の絶対値が左右の両端とも予め設定した値よりも大き
結画素領域だけを抽出し、得られた各水平ライン上の
連結画素領域が画像全体で統合されるものを仮の低輝度
文字領域とする第16の手段と、第13〜第16の手段
の実行順序を制御する第17の手段と、を用いて実現す
ることを特徴とする。
【0015】また、前記の第11の手段を、画像中の同
一ラベル領域内の各水平ライン毎に該領域の左右の両端
の部分から予め設定した画素幅だけ該領域の内側の画素
を除いた範囲で輝度値の平均値を算出する第18の手段
と、画像中の同一ラベル領域内で、第18の手段で求め
た各水平ライン毎の輝度平均値の垂直方向の分布におい
て、輝度平均値の極大値を持つ水平ラインを全て求め、
求めた各極大値水平ラインを開始ラインとし、該水平ラ
インを一ラインずつ上下に参照し、開始ラインの上下両
側でそれぞれ開始ラインの平均輝度値よりも予め設定し
た閾値だけ輝度値が低い最初の水平ラインを検出し、検
出された上下2つの水平ライン上の画素と該2つの水平
ラインの間に存在する画素を統合し、連結する複数の水
平ライン上の領域を抽出する第19の手段と、画像中の
同一ラベル領域内で、第19の手段で求めた連結する複
数の水平ライン毎の領域の上下の両端部における第18
の手段で求めた水平ライン毎の輝度平均値の垂直方向の
勾配値が上下の両端とも予め設定した値よりも大きい場
合、該連結水平ライン領域の画素を高輝度文字領域画素
として確定する第20の手段と、画像中の同一ラベル領
域内で、第18の手段で求めた各水平ライン毎の輝度平
均値の垂直方向の分布において、輝度平均値の極小値を
持つ水平ラインを全て求め、求めた各極小値水平ライン
を開始ラインとし、該水平ラインを一ラインずつ上下に
参照し、開始ラインの上下両側でそれぞれ開始ラインの
平均輝度値よりも予め設定した閾値だけ輝度値が高い最
初の水平ラインを検出し、検出された上下2つの水平ラ
イン上の画素と該2つの水平ラインの間に存在する画素
を統合し、連結する複数の水平ライン上の領域を抽出す
る第21の手段と、画像中の同一ラベル領域内で、第2
1の手段で求めた連結する複数の水平ライン上の領域の
上下の両端部における第18の手段で求めた水平ライン
毎の輝度平均値の垂直方向の勾配値が上下の両端とも予
め設定した値よりも大きい場合、該連結水平ライン領域
の画素を低輝度文字領域画素として確定する第22の手
段と、第18〜第22の手段の実行序を制御する第2
3の手段と、を用いて実現することを特徴とする。
【0016】同じく、前記の課題を解決するために、本
発明による画像中文字領域抽出方法は、カラー動画像中
の複数のフレーム画像の中から予め決められた方法を用
いて文字が表示されているフレーム画像と、該フレーム
画像よりも後の時刻のフレーム画像のうち該フレーム画
像中の文字と同一の文字が表示されているカラー画像を
複数枚入力して記憶する第1の手順と、第1の手順によ
り入力された複数の画像間で位置の対応する画素同士の
輝度、彩度、色相それぞれの平均値を各画素の値として
持つ平均値カラー画像を作成する第2の手順と、第2の
手順により得られた平均値カラー画像に対して、輝度値
が類似し、画像空間内で隣接する複数の画素同士を連結
領域として形成する第3の手順と、第3の手順により得
られた輝度値が類似する連結領域画像に対し、各領域内
で彩度値が類似し、画像空間内で隣接する複数の画素同
士を連結領域として形成する第4の手順と、第4の手順
により得られた輝度値、彩度値共に類似する連結領域画
像に対し、各領域内で色相値が類似し、画素空間内で隣
接する複数の画素を連結領域として形成する第5の手順
と、第5の手順により得られた輝度値、彩度値、色相値
共に類似する画像中の連結領域に対し、文字領域特徴を
満たさない連結領域を除去する第6の手順と、第6の手
順により得られた連結領域画像を文字領域抽出結果とし
て蓄積する第7の手順と、を有する映像中文字領域抽出
方法において、第3の手順を、画像中の各水平ライン内
の輝度分布中で輝度の極大値をとる画素付近で局所的に
輝度値が高い範囲を全て抽出し、抽出された高輝度範囲
とその他の範囲とで水平ラインの第一の二値化を行い、
また、各水平ライン内の輝度分布中で輝度の極小値をと
る画素付近で局所的に輝度値が低い範囲を全て抽出し、
抽出された低輝度範囲とその他の範囲とで水平ラインの
第二の二値化を行い、各水平ライン毎の第一の二値化結
果を統合することにより仮の高輝度文字領域を抽出し、
各水平ライン毎の第二の二値化結果を統合することによ
り仮の低輝度文字領域を抽出する第9の手順と、第9の
手順により得られた仮の高輝度文字領域画像中の各領域
毎に、通し番号をラベルとして付与し、また、第9の手
段により得られた仮の低輝度文字領域画像中の各領域毎
に通し番号をラベルとして付与するラベリング処理を行
う第10の手順と、第10の手順により得られたラベル
画像中の同一ラベルが付与さ れた個々の仮の高輝度文字
領域内で、及び個々の仮の低輝度文字領域内で垂直方向
の輝度分布を二値化することで仮の高輝度文字領域中の
高輝度文字領域画素、及び個々の仮の低輝度文字領域中
の低輝度文字領域画素を確定する第11の手順と、で実
行することを特徴とする。
【0017】
【0018】また、前記の第9の手順を、画像中のある
水平ライン内の輝度分布において、輝度の極大値を持つ
画素を全て求め、求めた各極大値画素を開始点とし、該
水平ライン上を一画素ずつ左右に走査し、開始点の極大
値画素の左右両側でそれぞれ開始点の輝度値よりも予め
設定した閾値だけ輝度値が低い最初の画素を検出し、検
出された左右2つの画素と該水平ライン上でそれら2つ
の画素の間に存在する複数の画素を連結画素領域として
抽出する第13の手順と、画像中のある水平ライン上
で、第13の手順により得られた連結画素領域の左右の
両端における水平方向の輝度勾配の絶対値が左右の両端
とも予め設定した値よりも大きい連結画素領域だけを抽
出し、得られた各水平ライン上の連結画素領域が画像全
体で統合されるものを仮の高輝度文字領域とする第14
の手順と、画像中のある水平ライン内の輝度分布におい
て、輝度の極小値を持つ画素を全て求め、求めた各極小
値画素を開始点とし、該水平ライン上を一画素ずつ左右
に走査し、開始点の極小値画素の左右両側でそれぞれ開
始点の輝度値よりも予め設定した閾値だけ輝度値が高い
最初の画素を検出し、検出された左右2つの画素と該水
平ライン上でそれら2つの画素の間に存在する複数の画
を連結画素領域として抽出する第15の手順と、画像
中のある水平ライン上で、第15の手順により得られた
連結画素領域の左右の両端における水平方向の輝度勾配
の絶対値が左右の両端とも予め設定した値よりも大き
結画素領域だけを抽出し、得られた各水平ライン上の
連結画素領域が画像全体で統合されるものを仮の低輝度
文字領域とする第16の手順と、で実行することを特徴
とする。
【0019】また、前記の第11の手順を、画像中の同
一ラベル領域内の各水平ライン毎に該領域の左右の両端
の部分から予め設定した画素幅だけ該領域の内側の画素
を除いた範囲で輝度値の平均値を算出する第18の手順
と、画像中の同一ラベル領域内で、第18の手順で求め
た各水平ライン毎の輝度平均値の垂直方向の分布におい
て、輝度平均値の極大値を持つ水平ラインを全て求め、
求めた各極大値水平ラインを開始ラインとし、該水平ラ
インを一ラインずつ上下に参照し、開始ラインの上下両
側でそれぞれ開始ラインの平均輝度値よりも予め設定し
た閾値だけ輝度値が低い最初の水平ラインを検出し、検
出された上下2つの水平ライン上の画素と該2つの水平
ラインの間に存在する画素を統合し、連結する複数の水
平ライン上の領域を抽出する第19の手順と、画像中の
同一ラベル領域内で、第19の手順で求めた連結する複
数の水平ライン毎の領域の上下の両端部における第18
の手順で求めた水平ライン毎の輝度平均値の垂直方向の
勾配値が上下の両端とも予め設定した値よりも大きい場
合、該連結水平ライン領域の画素を高輝度文字領域画素
として確定する第20の手順と、画像中の同一ラベル領
域内で、第18の手順で求めた各水平ライン毎の輝度平
均値の垂直方向の分布において、輝度平均値の極小値を
持つ水平ラインを全て求め、求めた各極小値水平ライン
を開始ラインとし、該水平ラインを一ラインずつ上下に
参照し、開始ラインの上下両側でそれぞれ開始ラインの
平均輝度値よりも予め設定した閾値だけ輝度値が高い最
初の水平ラインを検出し、検出された上下2つの水平ラ
イン上の画素と該2つの水平ラインの間に存在する画素
を統合し、連結する複数の水平ライン上の領域を抽出す
る第21の手順と、画像中の同一ラベル領域内で、第2
1の手順で求めた連結する複数の水平ライン上の領域の
上下の両端部における第18の手順で求めた水平ライン
毎の輝度平均値の垂直方向の勾配値が上下の両端とも予
め設定した値よりも大きい場合、該連結水平ライン領域
の画素を低輝度文字領域画素として確定する第22の手
順と、で実行することを特徴とする。
【0020】また、前記の映像中文字領域抽出方法にお
ける手順を、コンピュータに実行させるプログラムとし
て該コンピュータが読み取り可能な記録媒体に記録した
ことを特徴とする。
【0021】前記のとおり、NTSC形式の映像中のカ
ラー画像は、水平ライン方向に色の滲みが生じ、テロッ
プなどの文字部に関しても色劣化が生じる。ただし、色
劣化した場合でも一つの水平ライン上の輝度分布だけを
調べると、文字内の輝度の変化は小さく、文字と背景の
間のコントラストは高い場合が多いという性質をもつ。
図10は色劣化文字中のある走査線上の輝度分布の一例
を示した図であり、文字内で色劣化が生じてもある水平
ライン上の輝度分布には、文字内の高コントラスト部は
含まず、色劣化部も周囲の背景部とは十分に輝度の差が
存在するという特徴を持つことを示す。そこで、本発明
では、画像中の水平ライン単位で局所的に輝度値が高い
連結画素、あるいは局所的に輝度値が低い連結画素を文
字領域とすることにより、従来手法では困難であった高
輝度文字内の色劣化部を抽出することを可能とする。更
に、領域境界部での輝度勾配の勾配の絶対値が大きい場
合のみ文字領域として確定することにより、従来手法の
問題点であった周囲とのコントラストが低い領域の抽出
を抑制することを可能とする。図11に、本発明により
図12の画像から文字領域抽出を行った結果を、図14
の従来技術による抽出結果と対比させて示す。
【0022】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
【0023】図1は、本発明の一実施形態例による装置
の構成とともに処理の流れを示すブロック図である。
【0024】図1において、1はカラー動画像入力記憶
手段であり、処理対象の文字が表示されているカラー画
像データを、指定した複数枚入力してメモリに記憶す
る。
【0025】2は複数フレーム平均化部であり、カラー
動画像入力記憶手段1により入力された複数の画像間で
位置の対応する画素同士のRGB各成分の平均値を各画
素の値として持つ平均値カラー画像を作成する。
【0026】3は輝度値類似領域形成部であり、複数フ
レーム平均化部2により得られた平均値カラー画像中で
輝度値が類似し、画像空間内で隣接する複数の画素同士
を連結領域として形成する。
【0027】4は彩度値類似領域形成部であり、輝度値
類似領域形成部3により得られた輝度値が類似する連結
領域画像中の各領域内で彩度値が類似し、画像空間内で
隣接する複数の画素同士を連結領域として形成する。
【0028】5は色相値類似領域形成部であり、彩度値
類似領域形成部4により得られた輝度値、彩度値共に類
似する連結領域画像に対し、各領域内で色相値が類似
し、画素空間内で隣接する複数の画素を連結領域として
形成する。
【0029】6は背景領域除去部であり、色相値類似領
域形成部5により得られた輝度値、彩度値、色相値共に
類似する画像中の連結領域に対し、文字領域特徴を満た
さない連結領域を除去する。
【0030】7は文字領域画像蓄積部であり、背景領域
除去部6により得られた文字領域抽出結果画像を蓄積す
る。
【0031】8は処理制御部であり、上記1〜7の各部
の実行を制御する。
【0032】図2は、図1中の輝度値類似領域形成部3
の構成の一例とともに処理の流れの一例を示すブロック
図である。
【0033】図2において、9は水平ライン単位二値化
部であり、画像中の各水平ライン内で輝度の二値化を行
い、各水平ライン毎の二値結果を統合することにより仮
の文字領域を抽出する。
【0034】10は二値化結果ラベリング部であり、水
平ライン単位二値化部9により得られた仮の文字領域画
像中の各領域毎に、通し番号をラベルとして付与するラ
ベリング処理を行う。
【0035】11は輝度類似文字領域確定部であり、二
値化結果ラベリング部10により得られたラベル画像中
の同一ラベルが付与された仮の文字領域内で垂直方向の
輝度分布を二値化することで仮の文字領域中の文字領域
画素を確定する。
【0036】12は処理制御部であり、上記9〜11の
各部の実行を制御する。また、2,3,4はそれぞれ図
1中の同番号の部分と同一である。
【0037】図3は、図2中の水平ライン単位二値化部
9の構成の一例とともに処理の流れの一例を示すブロッ
ク図である。
【0038】図3において、13は水平ライン上輝度極
大値領域検出部であり、画像中のある水平ライン内の輝
度分布を調べ、該水平ライン内で局所的に輝度値が予め
設定した値だけ高い連結画素領域を抽出する。
【0039】14は仮高輝度文字領域抽出部であり、画
像中のある水平ライン上で、水平ライン上輝度極大値領
域検出部13により得られた連結画素領域の左右の両端
における水平方向の輝度勾配の絶対値が左右の両端とも
予め設定した値よりも大きい場合、該連結画素領域を仮
の高輝度文字領域とする。
【0040】15は水平ライン上輝度極小値領域検出部
であり、画像中のある水平ライン内の輝度分布を調べ、
該水平ライン内で局所的に輝度値が予め設定した値だけ
低い連結画素領域を抽出する。
【0041】16は仮低輝度文字領域抽出部であり、画
像中のある水平ライン上で、水平ライン上輝度極小値領
域検出部15により得られた連結画素領域の左右の両端
における水平方向の輝度勾配の絶対値が左右の両端とも
予め設定した値よりも大きい場合、該連結画素領域を仮
の低輝度文字領域とする。
【0042】17は処理制御部であり、13〜16の処
理部における実行を制御する。
【0043】図4は、図2中の輝度類似文字領域確定部
11の構成の一例とともに処理の流れの一例を示すブロ
ック図である。
【0044】図4において、18は水平ライン輝度平均
値算出部であり、画像中の同一ラベル領域内の各水平ラ
イン毎に該領域の左右の両端の部分から予め設定した画
素幅だけ内側の画素を除いた範囲で輝度値の平均値を算
出する。
【0045】19は垂直方向輝度極大水平ライン領域検
出部であり、水平ライン輝度平均値算出部18で求めた
各水平ライン上の輝度平均値の垂直方向の分布を調べ、
該領域内で局所的に輝度値が予め設定した値だけ高い連
結する複数の水平ライン上の領域を抽出する。
【0046】20は高輝度文字領域確定部であり、垂直
方向輝度極大水平ライン領域検出部19で求めた同一ラ
ベル領域内の連結する複数の水平ライン上の領域の上下
の両端部における水平ライン輝度平均算出部18で求め
た水平ライン毎の輝度平均値の垂直方向の勾配値が上下
の両端とも予め設定した値よりも大きい場合、該連結水
平ライン領域を高輝度文字領域として確定する。
【0047】21は垂直方向輝度極小水平ライン領域検
出部であり、水平ライン輝度平均値算出部18で求めた
各水平ライン上の輝度平均値の垂直方向の分布を調べ、
該領域内で局所的に輝度値が予め設定した値だけ低い連
結する複数の水平ライン上の領域を抽出する。
【0048】22は低輝度文字領域確定部であり、垂直
方向輝度極小水平ライン領域検出部19で求めた同一ラ
ベル領域内の連結する複数の水平ライン上の領域の上下
の両端部における水平ライン輝度平均算出部18で求め
た水平ライン毎の輝度平均値の垂直方向の勾配値が上下
の両端とも予め設定した値よりも大きい場合、該連結水
平ライン領域を低輝度文字領域として確定する。
【0049】23は処理制御部であり、18〜22の各
部における実行を制御する。
【0050】図5は、図2中の水平ライン単位輝度二値
化部9の処理の実施形態を説明するためのフローチャー
トである。
【0051】図5において、ステップ(30)は輝度値
画像をメモリに読み込む過程である。
【0052】ステップ(31)は、ステップ(30)で
メモリに読み込まれた輝度画像を水平ライン単位に分割
する過程である。
【0053】ステップ(32)は、輝度類似文字領域確
定処理の未処理の水平ラインが存在するかどうかを判断
する過程であり、未処理の水平ラインが存在すれば、ス
テップ(33)へ移り、未処理の水平ラインが存在しな
ければ、処理を終了する。
【0054】ステップ(33)は、ステップ(31)で
得られた画像中の各水平ライン上毎に輝度分布を調べ、
極大値を持つ画素を全て求める過程である。
【0055】ステップ(34)は、ステップ(31)で
得られた画像中の各水平ライン上毎に輝度分布を調べ、
極小値を持つ画素を全て求める過程である。
【0056】ステップ(35)は、ステップ(33)で
得られた極大値画素のうち、仮の高輝度文字領域抽出処
理の未処理の極大値画素が存在するかどうかを判断する
過程であり、未処理の極大値画素が存在すれば、ステッ
プ(36)へ移り、未処理の極大値画素が存在しなけれ
ば、ステップ(39)へ移る。
【0057】ステップ(36)は、ステップ(33)で
得られた極大値画素を開始点とし、左方向、及び右方向
に水平ライン上を一画素づつ走査し、極大値画素よりも
左側、右側でそれぞれ極大値より予め設定した閾値だけ
輝度値が低い最初の画素を検出し、検出された2つの画
素と該水平ライン上でそれら2つの画素の間に存在する
画素を連結画素領域として抽出する過程である。
【0058】ステップ(37)は、ステップ(36)で
得られた水平ライン上の連結画素領域の左右の両端部に
おける水平方向の輝度勾配の絶対値が、左右両方とも予
め設定した閾値よりも大きいかどうか判断する過程であ
り、大きいと判断された場合、ステップ(38)へ移
り、大きくないと判断された場合、ステップ(35)へ
移る。
【0059】ステップ(38)は、ステップ(36)で
得られた水平ライン上の連結画素領域を仮の高輝度文字
領域として抽出する過程であり、処理後はステップ(3
5)へ移る。
【0060】図6は、ステップ(36)、ステップ(3
7)、ステップ(38)を説明するための図であり、あ
る水平ライン上の極大輝度値画素1〜4について、仮の
高輝度文字領域が抽出されるかどうかを示す。極大輝度
値画素1,3は、左右の画素との輝度差、輝度勾配とも
条件を満たすため仮の高輝度文字領域として抽出される
が、極大輝度値画素2,4は条件をみたさないため、抽
出されない。
【0061】ステップ(39)は、ステップ(34)で
得られた極小値画素のうち、仮の低輝度文字領域抽出処
理の未処理の極小値画素が存在するかどうかを判断する
過程であり、未処理の極小値画素が存在すれば、ステッ
プ(40)へ移り、未処理の極小値画素が存在しなけれ
ば、ステップ(32)へ移る。
【0062】ステップ(40)は、ステップ(34)で
得られた極小値画素を開始点とし、左方向、及び右方向
に水平ライン上を一画素づつ走査し、極小値画素よりも
左側、右側でそれぞれ極小値より予め設定した閾値だけ
輝度値が高い最初の画素を検出し、検出された2つの画
素と該水平ライン上でそれら2つの画素の間に存在する
画素を連結画素領域として抽出する過程である。
【0063】ステップ(41)は、ステップ(40)で
得られた水平ライン上の連結画素領域の左右の両端部に
おける水平方向の輝度勾配の絶対値が、左右両方とも予
め設定した閾値よりも大きいかどうか判断する過程であ
り、大きいと判断された場合、ステップ(42)へ移
り、大きくないと判断された場合、ステップ(39)へ
移る。
【0064】ステップ(42)は、ステップ(40)で
得られた水平ライン上の連結画素領域を仮の低輝度文字
領域として抽出する過程であり、処理後はステップ(3
9)へ移る。
【0065】図7は、図2中の輝度類似文字領域確定部
11の処理の実施形態を説明するためのフローチャート
である。
【0066】図7において、ステップ(51)は、輝度
値画像、及び仮高輝度文字領域画像をメモリに読み込む
過程である。
【0067】ステップ(52)は、高輝度文字領域確定
処理の未処理の仮高輝度領域が存在するかどうか判断す
る過程であり、未処理の仮高輝度領域が存在すれば、ス
テップ(53)へ移り、未処理の仮高輝度領域が存在し
なければ、ステップ(59)へ移る。
【0068】ステップ(53)は、仮高輝度文字領域画
像中の同一ラベル領域内の各水平ライン毎に該領域の左
右の両端の部分から予め設定した画素幅だけ内側の画素
を除いた範囲で輝度値の平均値を算出する過程である。
【0069】ステップ(54)は、画像中の同一ラベル
領域内でステップ(53)で求めた各水平ライン毎の輝
度値の平均値を垂直方向に調べ、極大値となる輝度平均
値を持つ水平ラインを全て検出する過程である。
【0070】ステップ(55)は、高輝度文字領域確定
処理の未処理の極大輝度水平ラインが存在するかどうか
判断する過程であり、未処理の極大輝度水平ラインが存
在すれば、ステップ(56)に移り、未処理の極大輝度
水平ラインが存在しなければ、ステップ(52)に移
る。
【0071】ステップ(56)は、ステップ(54)で
得られた極大輝度水平ラインを開始ラインとし、上方
向、及び下方向に同一ラベル領域内を一水平ラインずつ
参照し、開始ラインよりも上側、下側でそれぞれ開始ラ
インの輝度平均値より予め設定した閾値だけ低い輝度平
均値を持つ最初の水平ラインを検出し、検出された2つ
の水平ライン上の画素と該同一ラベル領域内でそれら2
つの水平ラインの間に存在する水平ライン上の画素を統
合し、連結画素領域として抽出する過程である。このと
き、2つの水平ラインが検出される前に同一ラベル領域
の上端部、あるいは下端部の水平ラインに到達した場合
は、該水平ラインを連結画素領域の上端、あるいは下端
として検出する。
【0072】ステップ(57)は、ステップ(56)で
抽出した連結画素領域の上下の両端部において、垂直方
向の輝度勾配値の絶対値が予め設定した閾値より大きい
かどうか判断する過程であり、大きいと判断された場
合、ステップ(58)に移り、大きくないと判断された
場合、ステップ(55)に移る。
【0073】ステップ(58)は、ステップ(57)で
求めた上下の両端部における垂直方向の輝度勾配の絶対
値が、上下とも予め設定した閾値よりも大きい場合、該
連結画素領域を高輝度文字領域として確定する過程であ
る。
【0074】図8、図9は、ステップ(53),(5
6),(57),(58)を説明する図であり、図8で
は、黒い背景中に白い「雪」という文字が左右の両端部
で色劣化が生じ、表示されている例を用いる。水平ライ
ン毎に両端部の画素を除いた範囲で輝度の平均値を求め
ると、色劣化部を除いた値が得られることを示す。図9
では、「電」という文字の上にノイズ領域が統合されて
いる例を用いる。各水平ライン毎の輝度平均値を垂直方
向の分布から極大値を検出し、上部、下部に一定値だけ
輝度値が下がる水平ラインを検出すると「電」という文
字とノイズ領域が分離できる。
【0075】ステップ(59)は、仮低輝度文字領域画
像をメモリに読み込む過程である。
【0076】ステップ(60)は、低輝度文字領域確定
処理の未処理の仮低輝度領域が存在するかどうか判断す
る過程であり、未処理の仮低輝度領域が存在すれば、ス
テップ(61)へ移り、未処理の仮高輝度領域が存在し
なければ輝度類似文字領域確定部の処理を終了する。
【0077】ステップ(61)は、仮低輝度文字領域画
像中の同一ラベル領域内の各水平ライン毎に該領域の左
右の両端の部分から予め設定した画素幅だけ内側の画素
を除いた範囲で輝度値の平均値を算出する過程である。
【0078】ステップ(62)は、画像中の同一ラベル
領域内でステップ(61)で求めた各水平ライン毎の輝
度値の平均値を垂直方向に調べ、極小値となる輝度平均
値を持つ水平ラインを全て検出する過程である。
【0079】ステップ(63)は低輝度文字領域確定処
理の未処理の極小輝度水平ラインが存在するかどうか判
断する過程であり、未処理の極小輝度水平ラインが存在
すれば、ステップ(64)に移り、未処理の極小輝度水
平ラインが存在しなければ、ステップ(60)に移る。
【0080】ステップ(64)は、ステップ(62)で
得られた極小輝度水平ラインを開始ラインとし、上方
向、及び下方向に同一ラベル領域内を一水平ラインずつ
参照し、開始ラインよりも上側、下側でそれぞれ開始ラ
インの輝度平均値より予め設定した閾値だけ高い輝度平
均値を持つ最初の水平ラインを検出し、検出された2つ
の水平ライン上の画素と該同一ラベル領域内でそれら2
つの水平ラインの間に存在する水平ライン上の画素を統
合し、連結画素領域として抽出する過程である。このと
き、2つの水平ラインが検出される前に同一ラベル領域
の上端部、あるいは下端部の水平ラインに到達した場合
は、該水平ラインを連結画素領域の上端、あるいは下端
として検出する。
【0081】ステップ(65)は、ステップ(64)で
抽出した連結画素領域の上下の両端部において、垂直方
向の輝度勾配値の絶対値が予め設定した閾値より大きい
かどうか判断する過程であり、大きいと判断された場
合、ステップ(66)に移り、大きくないと判断された
場合、ステップ(63)に移る。
【0082】ステップ(66)は、ステップ(65)で
求めた上下の両端部における垂直方向の輝度勾配の絶対
値が、上下とも予め設定した閾値よりも大きい場合、該
連結画素領域を低輝度文字領域として確定する過程であ
る。
【0083】なお本発明は、記録媒体を読み取るための
読取装置と、文字認識対象のカラー画像や記録媒体から
読み取ったプログラム、抽出された文字領域画像等を格
納しそれを自由に読み出し可能なメモリ装置と、各種の
処理を行う際に必要なデータを保持するためのバッファ
やそれに準ずる装置と、その処理の過程で必要な情報を
表示したりカラー画像や文字認識結果等をモニタしたり
するためのディスプレイなどの出力装置と、必要な指示
を与えるためのキーボードやマウスなどの入力装置とを
備え、それらのメモリ装置、バッファ、出力装置及び入
力装置などを上記プログラムによって予め定められた手
順に基いて制御するコンピュータやそれに準ずる装置に
より、図1〜図9を用いて説明した本発明の実施形態例
の各部での処理の手順ないしアルゴリズムを適宜、実行
することが可能であり、その手順ないしアルゴリズムを
コンピュータ等に実行させるためのプログラムを上記読
取装置が読み取り可能な記録媒体、例えばフロッピーデ
ィスクやメモリカード、MO、CD、DVDなどに記録
して配布することが可能である。
【0084】
【発明の効果】以上の説明のとおり、本発明によれば、
画像中の水平ライン単位で局所的に輝度値が高い、ある
いは低い連結画素を文字領域とすることで色劣化文字の
領域抽出が可能となる。また、このとき領域境界部の輝
度勾配の絶対値が高い領域を文字領域として抽出するた
め、周囲の部分と低コントラストの領域の過剰抽出を抑
制する効果も得られる。
【図面の簡単な説明】
【図1】本発明の一実施形態例による映像中文字領域抽
出装置の構成とともに処理の流れを示すブロック図であ
る。
【図2】図1中の輝度値類似領域形成部3の構成の一例
とともに処理の流れの一例を示すブロック図である。
【図3】図2中の水平ライン単位二値化部9の構成の一
例とともに処理の流れの一例を示すブロック図である。
【図4】図2中の輝度類似文字領域確定部11の構成の
一例とともに処理の流れの一例を示すブロック図であ
る。
【図5】図2中の水平ライン単位二値化部9の処理内容
の一例を示すフローチャートである。
【図6】図2中の水平ライン単位二値化部9の処理実施
の一例を説明するための捕捉図である。
【図7】図2中の輝度類似文字領域確定部11の処理内
容の一例を示すフローチャートである。
【図8】図2中の輝度類似文字領域確定部11の処理実
施の一例を説明するための捕捉図(その1)である。
【図9】図2中の輝度類似文字領域確定部11の処理実
施の一例を説明するための捕捉図(その2)である。
【図10】色劣化文字中の、ある水平ライン上の輝度分
布の一例を示す図である。
【図11】本発明により図12の色劣化画像中から文字
領域を抽出した結果を示す画像である。
【図12】NTSC形式の映像中文字の色劣化の一例を
示す画像である。
【図13】色劣化文字の模式図である。
【図14】従来手法により図12の色劣化画像中から文
字領域を抽出した結果を示す画像である。
【符号の説明】
1…カラー動画像入力記憶手段 2…複数フレーム平均化部 3…輝度値類似領域形成部 4…彩度値類似領域形成部 5…色相値類似領域形成部 6…背景領域除去部 7…文字領域画像蓄積部 8…処理制御部 9…水平ライン単位二値化部 10…二値化結果ラベリング部 11…輝度類似文字領域確定部 12…処理制御部 13…水平ライン上輝度極大値領域検出部 14…仮高輝度文字領域抽出部 15…水平ライン上輝度極小値領域検出部 16…仮低輝度文字領域抽出部 17…処理制御部 18…水平ライン輝度平均値算出部 19…垂直方向輝度極大水平ライン領域検出部 20…高輝度文字領域確定部 21…垂直方向輝度極小水平ライン領域検出部 22…低輝度文字領域確定部 23…処理制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小倉 健司 東京都新宿区西新宿3丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平4−74283(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 9/74 G06T 7/40 100 H04N 5/91 H04N 9/00 H04N 9/79 JICSTファイル(JOIS)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 カラー動画像中の複数のフレーム画像の
    中から予め決められた方法を用いて文字が表示されてい
    るフレーム画像と、該フレーム画像よりも後の時刻のフ
    レーム画像のうち該フレーム画像中の文字と同一の文字
    が表示されているカラー画像を複数枚入力して記憶する
    第1の手段と、 第1の手段により入力された複数の画像間で位置の対応
    する画素同士の輝度、彩度、色相それぞれの平均値を各
    画素の値として持つ平均値カラー画像を作成する第2の
    手段と、 第2の手段により得られた平均値カラー画像に対して、
    輝度値が類似し、画像空間内で隣接する複数の画素同士
    を連結領域として形成する第3の手段と、 第3の手段により得られた輝度値が類似する連結領域画
    像に対し、各領域内で彩度値が類似し、画像空間内で隣
    接する複数の画素同士を連結領域として形成する第4の
    手段と、 第4の手段により得られた輝度値、彩度値共に類似する
    連結領域画像に対し、各領域内で色相値が類似し、画素
    空間内で隣接する複数の画素を連結領域として形成する
    第5の手段と、 第5の手段により得られた輝度値、彩度値、色相値共に
    類似する画像中の連結領域に対し、文字領域特徴を満た
    さない連結領域を除去する第6の手段と、 第6の手段により得られた連結領域画像を文字領域抽出
    結果として蓄積する第7の手段と、 第1〜第7の手段の実行順序を制御する第8の手段と、
    を有する 映像中文字領域抽出装置において 3の手段を、 画像中の各水平ライン内の輝度分布中で輝度の極大値を
    とる画素付近で局所的に輝度値が高い範囲を全て抽出
    し、抽出された高輝度範囲とその他の範囲とで水平ライ
    ンの第一の二値化を行い、また、各水平ライン内の輝度
    分布中で輝度の極小値をとる画素付近で局所的に輝度値
    が低い範囲を全て抽出し、抽出された低輝度範囲とその
    他の範囲とで水平ラインの第二の二値化を行い、各水平
    ライン毎の第一の二値化結果を統合することにより仮の
    高輝度文字領域を抽出し、各水平ラ イン毎の第二の二値
    化結果を統合することにより仮の低輝度文字領域を抽出
    する第9の手段と、 第9の手段により得られた仮の高輝度文字領域画像中の
    各領域毎に、通し番号をラベルとして付与し、また、第
    9の手段により得られた仮の低輝度文字領域画像中の各
    領域毎に通し番号をラベルとして付与するラベリング処
    理を行う第10の手段と、 第10の手段により得られたラベル画像中の同一ラベル
    が付与された個々の仮の高輝度文字領域内で、及び個々
    の仮の低輝度文字領域内で垂直方向の輝度分布を二値化
    することで仮の高輝度文字領域中の高輝度文字領域画
    、及び個々の仮の低輝度文字領域中の低輝度文字領域
    画素確定する第11の手段と、 第9〜第11の手段の実行順序を制御する第12の手段
    と、 を用いて実現することを特徴とする映像中文字領域抽出
    装置。
  2. 【請求項2】 請求項記載の映像中文字領域抽出装置
    において 9の手段を、 画像中のある水平ライン内の輝度分布において、輝度の
    極大値を持つ画素を全て求め、求めた各極大値画素を開
    始点とし、該水平ライン上を一画素ずつ左右に走査し、
    開始点の極大値画素の左右両側でそれぞれ開始点の輝度
    値よりも予め設定した閾値だけ輝度値が低い最初の画素
    を検出し、検出された左右2つの画素と該水平ライン上
    でそれら2つの画素の間に存在する複数の画素を連結画
    素領域として抽出する第13の手段と、 画像中のある水平ライン上で、第13の手段により得ら
    れた連結画素領域の左右の両端における水平方向の輝度
    勾配の絶対値が左右の両端とも予め設定した値よりも大
    い連結画素領域だけを抽出し、得られた各水平ライン
    上の連結画素領域が画像全体で統合されるものを仮の高
    輝度文字領域とする第14の手段と、 画像中のある水平ライン内の輝度分布において、輝度の
    極小値を持つ画素を全て求め、求めた各極小値画素を開
    始点とし、該水平ライン上を一画素ずつ左右に走査し、
    開始点の極小値画素の左右両側でそれぞれ開始点の輝度
    値よりも予め設定した閾値だけ輝度値が高い最初の画素
    を検出し、検出された左右2つの画素と該水平ライン上
    でそれら2つの画素の間に存在する複数の画素を連結画
    素領域 して抽出する第15の手段と、 画像中のある水平ライン上で、第15の手段により得ら
    れた連結画素領域の左右の両端における水平方向の輝度
    勾配の絶対値が左右の両端とも予め設定した値よりも大
    い連結画素領域だけを抽出し、得られた各水平ライン
    上の連結画素領域が画像全体で統合されるものを仮の低
    輝度文字領域とする第16の手段と、 第13〜第16の手段の実行順序を制御する第17の手
    段と、 を用いて実現することを特徴とする映像中文字領域抽出
    装置。
  3. 【請求項3】 請求項の映像中文字領域抽出装置にお
    いて 11の手段を、 画像中の同一ラベル領域内の各水平ライン毎に該領域の
    左右の両端の部分から予め設定した画素幅だけ該領域の
    内側の画素を除いた範囲で輝度値の平均値を算出する第
    18の手段と、 画像中の同一ラベル領域内で、第18の手段で求めた各
    水平ライン毎の輝度平均値の垂直方向の分布において、
    輝度平均値の極大値を持つ水平ラインを全て求め、求め
    た各極大値水平ラインを開始ラインとし、該水平ライン
    を一ラインずつ上下に参照し、開始ラインの上下両側で
    それぞれ開始ラインの平均輝度値よりも予め設定した閾
    値だけ輝度値が低い最初の水平ラインを検出し、検出さ
    れた上下2つの水平ライン上の画素と該2つの水平ライ
    ンの間に存在する画素を統合し、連結する複数の水平ラ
    イン上の領域を抽出する第19の手段と、 画像中の同一ラベル領域内で、第19の手段で求めた連
    結する複数の水平ライン毎の領域の上下の両端部におけ
    る第18の手段で求めた水平ライン毎の輝度平均値の垂
    直方向の勾配値が上下の両端とも予め設定した値よりも
    大きい場合、該連結水平ライン領域の画素を高輝度文字
    領域画素として確定する第20の手段と、 画像中の同一ラベル領域内で、第18の手段で求めた各
    水平ライン毎の輝度平均値の垂直方向の分布において、
    輝度平均値の極小値を持つ水平ラインを全て求め、求め
    た各極小値水平ラインを開始ラインとし、該水平ライン
    を一ラインずつ上下に参照し、開始ラインの上下両側で
    それぞれ開始ラインの平均輝度値よりも予め設定した閾
    値だけ輝度値が高い最初の水平ラインを検出し、検出さ
    れた上下 2つの水平ライン上の画素と該2つの水平ライ
    ンの間に存在する画素を統合し、連結する複数の水平ラ
    イン上の領域を抽出する第21の手段と、 画像中の同一ラベル領域内で、第21の手段で求めた連
    結する複数の水平ライン上の領域の上下の両端部におけ
    る第18の手段で求めた水平ライン毎の輝度平均値の垂
    直方向の勾配値が上下の両端とも予め設定した値よりも
    大きい場合、該連結水平ライン領域の画素を低輝度文字
    領域画素として確定する第22の手段と、 第18〜第22の手段の実行序を制御する第23の手
    段と、 を用いて実現することを特徴とする映像中文字領域抽出
    装置。
  4. 【請求項4】 カラー動画像中の複数のフレーム画像の
    中から予め決められた方法を用いて文字が表示されてい
    るフレーム画像と、該フレーム画像よりも後の時刻のフ
    レーム画像のうち該フレーム画像中の文字と同一の文字
    が表示されているカラー画像を複数枚入力して記憶する
    第1の手順と、 第1の手順により入力された複数の画像間で位置の対応
    する画素同士の輝度、彩度、色相それぞれの平均値を各
    画素の値として持つ平均値カラー画像を作成する第2の
    手順と、 第2の手順により得られた平均値カラー画像に対して、
    輝度値が類似し、画像空間内で隣接する複数の画素同士
    を連結領域として形成する第3の手順と、 第3の手順により得られた輝度値が類似する連結領域画
    像に対し、各領域内で彩度値が類似し、画像空間内で隣
    接する複数の画素同士を連結領域として形成する第4の
    手順と、 第4の手順により得られた輝度値、彩度値共に類似する
    連結領域画像に対し、各領域内で色相値が類似し、画素
    空間内で隣接する複数の画素を連結領域として形成する
    第5の手順と、 第5の手順により得られた輝度値、彩度値、色相値共に
    類似する画像中の連結領域に対し、文字領域特徴を満た
    さない連結領域を除去する第6の手順と、 第6の手順により得られた連結領域画像を文字領域抽出
    結果として蓄積する第7の手順と、 を有する 映像中文字領域抽出方法において 3の手順を、 画像中の各水平ライン内の輝度分布中で輝度の極大値を
    とる画素付近で局所的に輝度値が高い範囲を全て抽出
    し、抽出された高輝度範囲とその他の範囲とで水平ライ
    ンの第一の二値化を行い、また、各水平ライン内の輝度
    分布中で輝度の極小値をとる画素付近で局所的に輝度値
    が低い範囲を全て抽出し、抽出された低輝度範囲とその
    他の範囲とで水平ラインの第二の二値化を行い、各水平
    ライン毎の第一の二値化結果を統合することにより仮の
    高輝度文字領域を抽出し、各水平ライン毎の第二の二値
    化結果を統合することにより仮の低輝度文字領域を抽出
    する第9の手順と、 第9の手順により得られた仮の高輝度文字領域画像中の
    各領域毎に、通し番号をラベルとして付与し、また、第
    9の手段により得られた仮の低輝度文字領域画像中の各
    領域毎に通し番号をラベルとして付与するラベリング処
    理を行う第10の手順と、 第10の手順により得られたラベル画像中の同一ラベル
    が付与された個々の仮の高輝度文字領域内で、及び個々
    の仮の低輝度文字領域内で垂直方向の輝度分布を二値化
    することで仮の高輝度文字領域中の高輝度文字領域画
    、及び個々の仮の低輝度文字領域中の低輝度文字領域
    画素確定する第11の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
  5. 【請求項5】 請求項記載の映像中文字領域抽出方法
    において 9の手順を、 画像中のある水平ライン内の輝度分布において、輝度の
    極大値を持つ画素を全て求め、求めた各極大値画素を開
    始点とし、該水平ライン上を一画素ずつ左右に走査し、
    開始点の極大値画素の左右両側でそれぞれ開始点の輝度
    値よりも予め設定した閾値だけ輝度値が低い最初の画素
    を検出し、検出された左右2つの画素と該水平ライン上
    でそれら2つの画素の間に存在する複数の画素を連結画
    素領域として抽出する第13の手順と、 画像中のある水平ライン上で、第13の手順により得ら
    れた連結画素領域の左右の両端における水平方向の輝度
    勾配の絶対値が左右の両端とも予め設定した値よりも大
    い連結画素領域だけを抽出し、得られた各水平ライン
    上の連結画素領 域が画像全体で統合されるものを仮の高
    輝度文字領域とする第14の手順と、 画像中のある水平ライン内の輝度分布において、輝度の
    極小値を持つ画素を全て求め、求めた各極小値画素を開
    始点とし、該水平ライン上を一画素ずつ左右に走査し、
    開始点の極小値画素の左右両側でそれぞれ開始点の輝度
    値よりも予め設定した閾値だけ輝度値が高い最初の画素
    を検出し、検出された左右2つの画素と該水平ライン上
    でそれら2つの画素の間に存在する複数の画素を連結画
    素領域として抽出する第15の手順と、 画像中のある水平ライン上で、第15の手順により得ら
    れた連結画素領域の左右の両端における水平方向の輝度
    勾配の絶対値が左右の両端とも予め設定した値よりも大
    い連結画素領域だけを抽出し、得られた各水平ライン
    上の連結画素領域が画像全体で統合されるものを仮の低
    輝度文字領域とする第16の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
  6. 【請求項6】 請求項4記載の映像中文字領域抽出方法
    において 11の手順を、 画像中の同一ラベル領域内の各水平ライン毎に該領域の
    左右の両端の部分から予め設定した画素幅だけ該領域の
    内側の画素を除いた範囲で輝度値の平均値を算出する第
    18の手順と、 画像中の同一ラベル領域内で、第18の手順で求めた各
    水平ライン毎の輝度平均値の垂直方向の分布において、
    輝度平均値の極大値を持つ水平ラインを全て求め、求め
    た各極大値水平ラインを開始ラインとし、該水平ライン
    を一ラインずつ上下に参照し、開始ラインの上下両側で
    それぞれ開始ラインの平均輝度値よりも予め設定した閾
    値だけ輝度値が低い最初の水平ラインを検出し、検出さ
    れた上下2つの水平ライン上の画素と該2つの水平ライ
    ンの間に存在する画素を統合し、連結する複数の水平ラ
    イン上の領域を抽出する第19の手順と、 画像中の同一ラベル領域内で、第19の手順で求めた連
    結する複数の水平ライン毎の領域の上下の両端部におけ
    る第18の手順で求めた水平ライン毎の輝度平均値の垂
    直方向の勾配値が上下の両端とも予め設定した値よりも
    大きい場合、該連結水平ライン領域の画素を高輝度文字
    領域画素として確定する第20の手順と、 画像中の同一ラベル領域内で、第18の手順で求めた各
    水平ライン毎の輝度平均値の垂直方向の分布において、
    輝度平均値の極小値を持つ水平ラインを全て求め、求め
    た各極小値水平ラインを開始ラインとし、該水平ライン
    を一ラインずつ上下に参照し、開始ラインの上下両側で
    それぞれ開始ラインの平均輝度値よりも予め設定した閾
    値だけ輝度値が高い最初の水平ラインを検出し、検出さ
    れた上下2つの水平ライン上の画素と該2つの水平ライ
    ンの間に存在する画素を統合し、連結する複数の水平ラ
    イン上の領域を抽出する第21の手順と、 画像中の同一ラベル領域内で、第21の手順で求めた連
    結する複数の水平ライン上の領域の上下の両端部におけ
    る第18の手順で求めた水平ライン毎の輝度平均値の垂
    直方向の勾配値が上下の両端とも予め設定した値よりも
    大きい場合、該連結水平ライン領域の画素を低輝度文字
    領域画素として確定する第22の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
  7. 【請求項7】 請求項から請求項までのいずれかに
    記載の映像中文字領域抽出方法における手順を、コンピ
    ュータに実行させるプログラムとして該コンピュータが
    読み取り可能な記録媒体に記録した、 ことを特徴とする記録媒体。
JP03947198A 1997-12-04 1998-02-23 映像中文字領域抽出装置および方法および記録媒体 Expired - Lifetime JP3435334B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP03947198A JP3435334B2 (ja) 1998-02-23 1998-02-23 映像中文字領域抽出装置および方法および記録媒体
US09/204,957 US6366699B1 (en) 1997-12-04 1998-12-03 Scheme for extractions and recognitions of telop characters from video data
US09/967,431 US6501856B2 (en) 1997-12-04 2001-09-28 Scheme for extraction and recognition of telop characters from video data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03947198A JP3435334B2 (ja) 1998-02-23 1998-02-23 映像中文字領域抽出装置および方法および記録媒体

Publications (2)

Publication Number Publication Date
JPH11239363A JPH11239363A (ja) 1999-08-31
JP3435334B2 true JP3435334B2 (ja) 2003-08-11

Family

ID=12553992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03947198A Expired - Lifetime JP3435334B2 (ja) 1997-12-04 1998-02-23 映像中文字領域抽出装置および方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3435334B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672022B1 (en) 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
JP4143916B2 (ja) * 2003-02-25 2008-09-03 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4144374B2 (ja) * 2003-02-25 2008-09-03 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
US7941031B2 (en) * 2003-07-03 2011-05-10 Panasonic Corporation Video processing apparatus, IC circuit for video processing apparatus, video processing method, and video processing program
JP2007018248A (ja) * 2005-07-07 2007-01-25 Sony Corp 画像処理装置、画像処理方法及びプログラム
JP4796525B2 (ja) * 2007-03-20 2011-10-19 日本放送協会 多次元ラベリング装置、多次元ラベリングシステム及び多次元ラベリングプログラム

Also Published As

Publication number Publication date
JPH11239363A (ja) 1999-08-31

Similar Documents

Publication Publication Date Title
US6628833B1 (en) Image processing apparatus, image processing method, and recording medium with image processing program to process image according to input image
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US7769244B2 (en) Automatic digital film and video restoration
EP2492867A2 (en) Methods and systems for converting images from low dynamic range to high dynamic range
KR20040050909A (ko) 이미지의 영역들간 판별을 위한 방법 및 장치
JP2008522508A (ja) デジタル映像のアーティファクト削減
JP4423333B2 (ja) 背景領域特定方法、背景領域特定システム、背景色決定方法、制御プログラム、および、記録媒体
JP3435334B2 (ja) 映像中文字領域抽出装置および方法および記録媒体
JP3655110B2 (ja) 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
KR101224936B1 (ko) 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체
US6999621B2 (en) Text discrimination method and related apparatus
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JPH10320566A (ja) 画像処理装置、画像処理方法及びその方法を記憶した記憶媒体
JP3480408B2 (ja) 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体
US7599556B2 (en) Apparatus, system, and method for scanning segmentation
EP1654703B1 (en) Graphics overlay detection
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
US6750986B1 (en) Color image processing method with thin-line detection and enhancement
JPH10285399A (ja) 画像の二値化方法
JP2003219180A (ja) 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP3467195B2 (ja) 文字領域抽出方法および装置および記録媒体
JP2012003480A (ja) テロップ文字領域検出装置、及びプログラム
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP3163601B2 (ja) 画像処理装置および方法
JP3949954B2 (ja) ドロップアウトカラー識別処理プログラム、方法、および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term