JPH11239363A - Device for extracting character area in video image, its method and medium for recording its method - Google Patents

Device for extracting character area in video image, its method and medium for recording its method

Info

Publication number
JPH11239363A
JPH11239363A JP10039471A JP3947198A JPH11239363A JP H11239363 A JPH11239363 A JP H11239363A JP 10039471 A JP10039471 A JP 10039471A JP 3947198 A JP3947198 A JP 3947198A JP H11239363 A JPH11239363 A JP H11239363A
Authority
JP
Japan
Prior art keywords
area
image
luminance
value
horizontal line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10039471A
Other languages
Japanese (ja)
Other versions
JP3435334B2 (en
Inventor
Hidekatsu Kuwano
秀豪 桑野
Hiroyuki Arai
啓之 新井
Masaharu Kurakake
正治 倉掛
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03947198A priority Critical patent/JP3435334B2/en
Priority to US09/204,957 priority patent/US6366699B1/en
Publication of JPH11239363A publication Critical patent/JPH11239363A/en
Priority to US09/967,431 priority patent/US6501856B2/en
Application granted granted Critical
Publication of JP3435334B2 publication Critical patent/JP3435334B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Color Television Systems (AREA)
  • Processing Of Color Television Signals (AREA)
  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To extract a deteriorated color part in characters with high luminance and to suppress extraction of an area with a low contrast with respect to its surrounding areas in the case of extracting a character area from an image. SOLUTION: A plural frames averaging section 2 receives a plurality of color images and obtains a mean value of each of RGB components of pixels corresponding to each other between images to generate a mean color image. A similar luminance value area generating section 3 sets a plurality of adjacent pixels as a connection area whose luminance values are similar in the means value color image. A similar saturation value area generating section 4 sets a plurality of adjacent pixels as a connection area whose saturation values are similar in the connection area in which the luminance is also similar. A similar hue value area generating section 5 sets a plurality of adjacent pixels as a connection area whose hue values are similar in the connection area in which the luminance and the saturation area similar. A background area elimination section 6 eliminates a connection area not satisfying a character area characteristic with respect to the connection area where the luminance value, the saturation value and the hue value are similar to obtain a character area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えばテレビ放送
の映像等のカラー動画像を構成する複数のフレームにお
いて、テロップ文字等の文字が表示されているフレーム
画像の中から文字部分を画素連結領域として抽出する文
字領域抽出技術に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a plurality of frames forming a color moving image such as a video image of a television broadcast, for example, by connecting a character portion from a frame image in which characters such as telop characters are displayed to a pixel connection area. The present invention relates to a character area extraction technique for extracting a character region.

【0002】[0002]

【従来の技術】カラー動画像を構成する複数のフレーム
の中の文字が表示されているフレーム画像、あるいは文
字が表示されている静止カラー画像に関して、少ない計
算量で安定的に文字部分を画素連結領域として抽出する
文字領域抽出技術に関しては、従来から多くの研究が行
われている。それらの中で、参考文献1「H.Kuwa
no,S.Kurakake,K.Odaka,”Te
lop Character Extraction
from Video Data”,Proc. of
IEEE International Works
hop on Document Image Ana
lysis, pp.82−88(1997−06)」
で提案されている文字領域抽出法がある。
2. Description of the Related Art With respect to a frame image in which characters in a plurality of frames constituting a color moving image are displayed or a still color image in which characters are displayed, a character portion is stably connected to a pixel with a small amount of calculation. A great deal of research has been conducted on character region extraction technology for extracting a region. Among them, reference 1 "H. Kuwa
no, S.M. Kurakake, K .; Odaka, "Te
lop Character Extraction
from Video Data ", Proc. of
IEEE International Works
hop on Document Image Ana
lysis, pp. 82-88 (1997-06) "
There is a character region extraction method proposed in US Pat.

【0003】この方法は、文字が表示されている入力カ
ラー画像に対して、画像の中の輝度、彩度、色相の順で
1次元色空間の分割を行うことで、輝度、彩度、色相が
類似し、画像空間内で隣接する画素連結領域の形成を行
い、次に形成した領域のうち、文字領域特徴を満たさな
い領域を除去するという方法をとっている。
In this method, a one-dimensional color space is divided into an input color image on which characters are displayed in the order of luminance, saturation, and hue in the image, thereby obtaining luminance, saturation, and hue. Are formed, adjacent pixel connection regions are formed in the image space, and a region that does not satisfy the character region feature is removed from the formed regions.

【0004】従来手法において、輝度空間の分割処理
は、画像中の局所的な矩形領域内での輝度空間に対し、
該矩形領域内で求めた閾値を用いて分割するため、画像
内の局所的な輝度変動がある場合でも良好な文字領域抽
出結果が得られるという特徴がある。
[0004] In the conventional method, a process of dividing a luminance space is performed on a luminance space within a local rectangular area in an image.
Since the image is divided using the threshold value obtained in the rectangular area, a good character area extraction result can be obtained even when there is local luminance variation in the image.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、前記の
従来手法においては、入力される文字表示カラー画像が
テレビ放送などで使用されているNTSC信号形式の映
像中の画像の場合、色劣化した文字の色劣化部が途切れ
た文字領域が抽出されてしまう問題点がある。
However, in the above-mentioned conventional method, when the input character display color image is an image in a video in the NTSC signal format used in television broadcasting or the like, the character of color-degraded characters is not displayed. There is a problem that a character area in which the color deterioration portion is interrupted is extracted.

【0006】通常、NTSC信号形式の動画像には、画
像内の各走査線に沿って各画素の色が滲み、画像内の文
字については背景との左右の境界部で背景部の色が文字
内部に滲んで、本来の色が劣化してしまうという特徴が
ある。色劣化は、文字内の横成分に関しては左右の端の
み起こり、中心部は影響を受けず、縦成分に関しては文
字幅が狭いために全体が劣化して輝度が低下し、文字内
の横成分と縦成分の輝度コントラストが高くなる場合が
ある(図12、図13参照)。このため、前記の従来手
法において、NTSC信号形式の動画像中の色が劣化し
た文字の横成分と縦成分の接続部を含むような矩形領域
内で閾値を決定すると色劣化した縦成分が背景としてみ
なされてしまい、結果として文字領域が途切れて抽出さ
れてしまう(図14参照)。
Normally, in a moving image of the NTSC signal format, the color of each pixel is blurred along each scanning line in the image, and the color of the background is changed at the right and left borders of the character in the image. There is a feature that the original color deteriorates by bleeding inside. The color degradation occurs only at the left and right edges of the horizontal component in the character, the central part is not affected, and the vertical component has a narrow character width, resulting in overall deterioration and lowering of the luminance. And the luminance contrast of the vertical component may increase (see FIGS. 12 and 13). For this reason, in the above-described conventional method, when a threshold value is determined in a rectangular area including a connection portion between a horizontal component and a vertical component of a character whose color in a moving image in the NTSC signal format has deteriorated, the vertical component whose color has deteriorated is , And as a result, the character area is cut off and extracted (see FIG. 14).

【0007】図12は、NTSC形式の映像中に表示さ
れる文字内に生じる色劣化の一例を示した図である。黒
い背景が白い「音響エコーキャンセラ、Acousti
c Echo Canceller」という文字の内部
に滲み、文字内の縦成分が灰色に劣化している。
FIG. 12 is a diagram showing an example of color deterioration occurring in characters displayed in an NTSC format video. Acoustic Echo Canceller, Acoustic with Black White Background
c Echo Canceller ", and the vertical component in the character is degraded to gray.

【0008】図13は、文字内色劣化の模式図であり、
黒い背景中の白い文字「t」というテロップ文字の内部
に黒い背景色が滲み、文字内部の色が部分的に灰色に変
色する色劣化の模式図である。文字内の横成分に関して
は左右の端のみ色劣化を起こし、中心部は影響を受けな
い(図13中領域A)。縦成分に関しては文字幅が狭い
ために全体が劣化して輝度が低下し(図13中領域
B)、文字内の横成分と縦成分の輝度コントラストが大
きくなる。このような場合、従来の二値化法[参考文献
1]によると、領域Bが背景とみなされる場合があっ
た。
FIG. 13 is a schematic diagram of color deterioration in a character.
FIG. 9 is a schematic diagram of color deterioration in which a black background color is blurred inside a telop character called a white character “t” in a black background, and the color inside the character is partially changed to gray. Regarding the horizontal component in the character, color deterioration occurs only on the left and right ends, and the central part is not affected (region A in FIG. 13). As for the vertical component, since the character width is narrow, the whole is deteriorated and the luminance is reduced (region B in FIG. 13), and the luminance contrast between the horizontal component and the vertical component in the character is increased. In such a case, according to the conventional binarization method [Reference Document 1], the area B may be regarded as the background.

【0009】図14は、従来手法[参考文献1]で図1
2のカラー画像から文字領域を抽出した結果であり、各
文字の色劣化部が途切れた結果となる。
FIG. 14 shows a conventional method [Ref. 1] and FIG.
This is the result of extracting the character area from the color image No. 2 and the result is that the color deteriorated portion of each character is interrupted.

【0010】また、通常、画像中に表示されるテロップ
文字等の文字は、周囲の部分との色のコントラストが非
常に高いという特徴を持つ。前記の従来手法では、画素
連結領域の形成を色空間の分割処理のみで行い、画像空
間内の色分布の特徴を考慮していないため、周囲の部分
との色のコントラストが低い連結画素領域も抽出してし
まい、文字以外の領域を多数抽出してしまうという問題
点もある。
[0010] In general, characters such as telop characters displayed in an image have a feature that the color contrast with surrounding portions is very high. In the above-described conventional method, the formation of the pixel connection region is performed only by the color space division process, and the characteristics of the color distribution in the image space are not taken into account. There is also a problem in that extraction is performed, and many areas other than characters are extracted.

【0011】そこで本発明は、画像中から文字領域を抽
出する際に、高輝度文字内の色劣化部を抽出でき、周囲
とのコントラストが低い領域の抽出を抑制できる画像中
文字領域抽出装置および方法を提供することを課題とす
る。
Therefore, the present invention provides a character region extracting device for an image which can extract a color-degraded portion in a high-luminance character when extracting a character region from an image and can suppress extraction of a region having low contrast with the surroundings. It is an object to provide a method.

【0012】[0012]

【課題を解決するための手段】前記の課題を解決するた
めに、本発明による映像中文字領域抽出装置は、カラー
動画像中の複数のフレーム画像の中から予め決められた
方法を用いて文字が表示されているフレーム画像と、該
フレーム画像よりも後の時刻のフレーム画像のうち該フ
レーム画像中の文字と同一の文字が表示されているカラ
ー画像を複数枚入力して記憶する第1の手段と、第1の
手段により入力された複数の画像間で位置の対応する画
素同士の輝度、彩度、色相それぞれの平均値を各画素の
値として持つ平均値カラー画像を作成する第2の手段
と、第2の手段により得られた平均値カラー画像に対し
て、輝度値が類似し、画像空間内で隣接する複数の画素
同士を連結領域として形成する第3の手段と、第3の手
段により得られた輝度値が類似する連結領域画像に対
し、各領域内で彩度値が類似し、画像空間内で隣接する
複数の画素同士を連結領域として形成する第4の手段
と、第4の手段により得られた輝度値、彩度値共に類似
する連結領域画像に対し、各領域内で色相値が類似し、
画素空間内で隣接する複数の画素を連結領域として形成
する第5の手段と、第5の手段により得られた輝度値、
彩度値、色相値共に類似する画像中の連結領域に対し、
文字領域特徴を満たさない連結領域を除去する第6の手
段と、第6の手段により得られた連結領域画像を文字領
域抽出結果として蓄積する第7の手段と、第1〜第7の
手段の実行順序を制御する第8の手段と、を有すること
を特徴とする。
In order to solve the above-mentioned problems, a character region extracting apparatus for a video according to the present invention uses a predetermined method from a plurality of frame images in a color moving image. And a plurality of color images in which the same characters as the characters in the frame image are displayed among the frame images displayed at the time after the frame image and the first frame image. Means for generating an average color image having average values of luminance, saturation, and hue of pixels corresponding to the positions of the plurality of images input by the first means as values of the pixels; A third means for forming a plurality of pixels having similar luminance values and adjacent pixels in an image space as a connected area with respect to the average color image obtained by the second means; Brightness obtained by means For a connected area image having similar values, a fourth means for forming a plurality of pixels having similar saturation values in each area and forming a plurality of adjacent pixels in an image space as a connected area, and a fourth means for obtaining a fourth area. Hue values are similar in each area for connected area images with similar luminance and saturation values,
A fifth unit for forming a plurality of pixels adjacent in the pixel space as a connected region, and a luminance value obtained by the fifth unit.
For the connected area in the image where both the saturation value and the hue value are similar,
Sixth means for removing a connected area that does not satisfy the character area feature, seventh means for accumulating the connected area image obtained by the sixth means as a character area extraction result, and first to seventh means Eighth means for controlling the execution order.

【0013】また、前記の第3の手段を、画像中の各水
平ライン内で輝度の二値化を行い、各水平ライン毎の二
値化結果を統合することにより仮の文字領域を抽出する
第9の手段と、第9の手段により得られた仮の文字領域
画像中の各領域毎に、通し番号をラベルとして付与する
ラベリング処理を行う第10の手段と、第10の手段に
より得られたラベル画像中の同一ラベルが付与された仮
の文字領域内で垂直方向の輝度分布を二値化することで
仮の文字領域中の文字領域画素を選択する第11の手段
と、第9〜第11の手段の実行順序を制御する第12の
手段と、を用いて実現することを特徴とする。
The third means extracts a temporary character area by binarizing the luminance within each horizontal line in the image and integrating the binarization results for each horizontal line. A ninth means, a tenth means for performing a labeling process for giving a serial number as a label to each area in the temporary character area image obtained by the ninth means, and a tenth means obtained by the tenth means An eleventh means for selecting a character area pixel in the temporary character area by binarizing the luminance distribution in the vertical direction in the temporary character area to which the same label is assigned in the label image; And a twelfth means for controlling the execution order of the eleventh means.

【0014】また、前記の第9の手段を、画像中のある
水平ライン内の輝度分布を調べ、該水平ライン内で局所
的に輝度値が周辺部と比較して予め設定した値だけ高い
範囲を連結画素領域を抽出する第13の手段と、画像中
のある水平ライン上で、第13の手段により得られた連
結画素領域の左右の両端における水平方向の輝度勾配の
絶対値が左右の両端とも予め設定した値よりも大きい場
合、該連結画素領域を仮の高輝度文字領域とする第14
の手段と、画像中のある水平ライン内の輝度分布を調
べ、該水平ライン内で局所的に輝度値が周辺部と比較し
て予め設定した値だけ低い範囲を連結画素領域を抽出す
る第15の手段と、画像中のある水平ライン上で、第1
5の手段により得られた連結画素領域の左右の両端にお
ける水平方向の輝度勾配の絶対値が左右の両端とも予め
設定した値よりも大きい場合、該連結画素領域を仮の低
輝度文字領域とする第16の手段と、第13〜第16の
手段の実行順序を制御する第17の手段と、を用いて実
現することを特徴とする。
Further, the ninth means is to examine a luminance distribution in a certain horizontal line in an image, and to locally compare the luminance value in the horizontal line with a peripheral portion by a predetermined value. And the absolute value of the luminance gradient in the horizontal direction at both the left and right ends of the connected pixel area obtained by the thirteenth means on a certain horizontal line in the image. If both are larger than a preset value, the connected pixel area is set as a temporary high-brightness character area.
And means for examining the luminance distribution in a certain horizontal line in the image, and extracting a connected pixel region in a range where the luminance value is locally lower than the peripheral portion by a predetermined value in the horizontal line. Means on a horizontal line in the image,
If the absolute value of the horizontal luminance gradient at both the left and right ends of the connected pixel region obtained by the means in 5 is larger than a preset value at both the left and right ends, the connected pixel region is set as a temporary low-luminance character region. This is realized by using a sixteenth means and a seventeenth means for controlling the execution order of the thirteenth to sixteenth means.

【0015】また、ラベル画像中の同一ラベルが付与さ
れた仮の文字領域内で垂直方向の輝度分布を二値化する
ことで仮の文字領域中の文字領域画素を確定する第11
の手段を、画像中の同一ラベル領域内の各水平ライン毎
に該領域の左右の両端の部分から予め設定した画素幅だ
け該領域の内側の画素を除いた範囲で輝度値の平均値を
算出する第18の手段と、画像中の同一ラベル領域内
で、第18の手段で求めた各水平ライン毎の輝度平均値
の垂直方向の分布を調べ、該同一ラベル領域内で局所的
に水平ライン毎の平均輝度値が周辺部と比較して予め設
定した値だけ高い連結する複数の水平ライン上の領域を
抽出する第19の手段と、画像中の同一ラベル領域内
で、第19の手段で求めた連結する複数の水平ライン毎
の領域の上下の両端部における第18の手段で求めた水
平ライン毎の輝度平均値の垂直方向の勾配値が上下の両
端とも予め設定した値よりも大きい場合、該連結水平ラ
イン領域を高輝度文字領域として確定する第20の手段
と、画像中の同一ラベル領域内で、第18の手段で求め
た各水平ライン毎の輝度平均値の垂直方向の分布を調
べ、該同一ラベル領域内で局所的に水平ライン毎の平均
輝度値が周辺部と比較して予め設定した値だけ低い連結
する複数の水平ライン上の領域を抽出する第21の手段
と、画像中の同一ラベル領域内で、第21の手段で求め
た連結する複数の水平ライン上の領域の上下の両端部に
おける第18の手段で求めた水平ライン毎の輝度平均値
の垂直方向の勾配値が上下の両端とも予め設定した値よ
りも大きい場合、該連結水平ライン領域を低輝度文字領
域として確定する第22の手段と、第18〜第22の手
段の実行頂序を制御する第23の手段と、を用いて実現
することを特徴とする。
[0015] Further, by binarizing the luminance distribution in the vertical direction in the provisional character area to which the same label in the label image is assigned, the character area pixels in the provisional character area are determined.
Means is calculated for each horizontal line in the same label area in the image, from the left and right ends of the area by a predetermined pixel width, excluding pixels inside the area by a predetermined pixel width. In the eighteenth means, the vertical distribution of the average luminance value for each horizontal line obtained by the eighteenth means in the same label area in the image is examined, and the horizontal lines are locally detected in the same label area. A nineteenth means for extracting an area on a plurality of connected horizontal lines in which the average luminance value for each is higher than a peripheral part by a predetermined value, and a nineteenth means in the same label area in the image When the vertical gradient value of the average luminance value for each horizontal line obtained by the eighteenth means at the upper and lower ends of the region for each of the plurality of connected horizontal lines is larger than a preset value at both the upper and lower ends. , The connected horizontal line area In the twentieth means for determining the area, and within the same label area in the image, the vertical distribution of the average luminance value for each horizontal line obtained by the eighteenth means is examined. A twenty-first means for extracting regions on a plurality of connected horizontal lines in which the average luminance value for each horizontal line is lower than a peripheral portion by a predetermined value; The vertical gradient value of the luminance average value for each horizontal line obtained by the eighteenth means at the upper and lower ends of the region on the plurality of horizontal lines to be connected obtained by the means is higher than the preset value at both the upper and lower ends. Is larger, a twenty-second means for determining the connected horizontal line area as a low-luminance character area and a twenty-third means for controlling the execution order of the eighteenth to twenty-second means are realized. Features.

【0016】同じく、前記の課題を解決するために、本
発明による画像中文字領域抽出方法は、カラー動画像中
の複数のフレーム画像の中から予め決められた方法を用
いて文字が表示されているフレーム画像と、該フレーム
画像よりも後の時刻のフレーム画像のうち該フレーム画
像中の文字と同一の文字が表示されているカラー画像を
複数枚入力して記憶する第1の手順と、第1の手順によ
り入力された複数の画像間で位置の対応する画素同士の
輝度、彩度、色相それぞれの平均値を各画素の値として
持つ平均値カラー画像を作成する第2の手順と、第2の
手順により得られた平均値カラー画像に対して、輝度値
が類似し、画像空間内で隣接する複数の画素同士を連結
領域として形成する第3の手順と、第3の手順により得
られた輝度値が類似する連結領域画像に対し、各領域内
で彩度値が類似し、画像空間内で隣接する複数の画素同
士を連結領域として形成する第4の手順と、第4の手順
により得られた輝度値、彩度値共に類似する連結領域画
像に対し、各領域内で色相値が類似し、画素空間内で隣
接する複数の画素を連結領域として形成する第5の手順
と、第5の手順により得られた輝度値、彩度値、色相値
共に類似する画像中の連結領域に対し、文字領域特徴を
満たさない連結領域を除去する第6の手順と、第6の手
順により得られた連結領域画像を文字領域抽出結果とし
て蓄積する第7の手順と、を有することを特徴とする。
Similarly, in order to solve the above-mentioned problem, a method for extracting a character area in an image according to the present invention comprises displaying a character from a plurality of frame images in a color moving image by using a predetermined method. A first procedure of inputting and storing a plurality of frame images and a plurality of color images in which characters identical to the characters in the frame images are displayed among frame images at times later than the frame images; and A second procedure of creating an average color image having average values of luminance, saturation, and hue of pixels corresponding to positions among a plurality of images input by the first procedure as values of respective pixels; A third procedure in which a plurality of pixels having similar luminance values and adjacent in the image space are formed as a connected area with respect to the average color image obtained in the second procedure, and a third procedure obtained by the third procedure Brightness value And a luminance value obtained by the fourth procedure in which a plurality of pixels having similar saturation values in each area and forming a plurality of adjacent pixels in the image space as a connected area are obtained. A fifth procedure of forming a plurality of pixels having similar hue values in each area and adjacent pixels in a pixel space as a connected area with respect to a connected area image having similar saturation values. A sixth procedure for removing a connected area that does not satisfy a character area feature from a connected area in an image having similar luminance values, saturation values, and hue values, and a connected area image obtained by the sixth procedure And accumulating as a character region extraction result.

【0017】また、前記の第3の手順を、画像中の各水
平ライン内で輝度の二値化を行い、各水平ライン毎の二
値化結果を統合することにより仮の文字領域を抽出する
第9の手順と、第9の手順により得られた仮の文字領域
画像中の各領域毎に、通し番号をラベルとして付与する
ラベリング処理を行う第10の手順と、第10の手順に
より得られたラベル画像中の同一ラベルが付与された仮
の文字領域内で垂直方向の輝度分布を二値化することで
仮の文字領域中の文字領域画素を選択する第11の手順
と、で実行することを特徴とする。
In the third procedure, a temporary character area is extracted by binarizing the luminance within each horizontal line in the image and integrating the binarization results of each horizontal line. A ninth procedure, a tenth procedure of performing a labeling process of assigning a serial number as a label to each area in the temporary character area image obtained by the ninth procedure, and a tenth procedure. An eleventh step of selecting a character area pixel in the temporary character area by binarizing the luminance distribution in the vertical direction in the temporary character area to which the same label is assigned in the label image. It is characterized by.

【0018】また、前記の第9の手順を、画像中のある
水平ライン内の輝度分布を調べ、該水平ライン内で局所
的に輝度値が周辺部と比較して予め設定した値だけ高い
範囲を連結画素領域を抽出する第13の手順と、画像中
のある水平ライン上で、第13の手順により得られた連
結画素領域の左右の両端における水平方向の輝度勾配の
絶対値が左右の両端とも予め設定した値よりも大きい場
合、該連結画素領域を仮の高輝度文字領域とする第14
の手順と、画像中のある水平ライン内の輝度分布を調
べ、該水平ライン内で局所的に輝度値が周辺部と比較し
て予め設定した値だけ低い範囲を連結画素領域を抽出す
る第15の手順と、画像中のある水平ライン上で、第1
5の手順により得られた連結画素領域の左右の両端にお
ける水平方向の輝度勾配の絶対値が左右の両端とも予め
設定した値よりも大きい場合、該連結画素領域を仮の低
輝度文字領域とする第16の手順と、で実行することを
特徴とする。
In the ninth procedure, the luminance distribution in a certain horizontal line in the image is examined, and the luminance value is locally increased in the horizontal line by a predetermined value compared with the peripheral portion. And the absolute value of the luminance gradient in the horizontal direction at both the left and right ends of the connected pixel area obtained by the thirteenth procedure on a certain horizontal line in the image If both are larger than a preset value, the connected pixel area is set as a temporary high-brightness character area.
And the luminance distribution in a certain horizontal line in the image is examined, and a range in which the luminance value is locally lower in the horizontal line by a predetermined value than the peripheral portion is extracted as a fifteenth step. Procedure, and on a horizontal line in the image, the first
If the absolute value of the horizontal luminance gradient at both the left and right ends of the connected pixel region obtained by the procedure of 5 is larger than a preset value at both the left and right ends, the connected pixel region is set as a temporary low-luminance character region. And a sixteenth procedure.

【0019】また、第11の手順を、画像中の同一ラベ
ル領域内の各水平ライン毎に該領域の左右の両端の部分
から予め設定した画素幅だけ該領域の内側の画素を除い
た範囲で輝度値の平均値を算出する第18の手順と、画
像中の同一ラベル領域内で、第18の手順で求めた各水
平ライン毎の輝度平均値の垂直方向の分布を調べ、該同
一ラベル領域内で局所的に水平ライン毎の平均輝度値が
周辺部と比較して予め設定した値だけ高い連結する複数
の水平ライン上の領域を抽出する第19の手順と、画像
中の同一ラベル領域内で、第19の手順で求めた連結す
る複数の水平ライン毎の領域の上下の両端部における第
18の手順で求めた水平ライン毎の輝度平均値の垂直方
向の勾配値が上下の両端とも予め設定した値よりも大き
い場合、該連結水平ライン領域を高輝度文字領域として
確定する第20の手順と、画像中の同一ラベル領域内
で、第18の手順で求めた各水平ライン毎の輝度平均値
の垂直方向の分布を調べ、該同一ラベル領域内で局所的
に水平ライン毎の平均輝度値が周辺部と比較して予め設
定した値だけ低い連結する複数の水平ライン上の領域を
抽出する第21の手順と、画像中の同一ラベル領域内
で、第21の手順で求めた連結する複数の水平ライン上
の領域の上下の両端部における第18の手順で求めた水
平ライン毎の輝度平均値の垂直方向の勾配値が上下の両
端とも予め設定した値よりも大きい場合、該連結水平ラ
イン領域を低輝度文字領域として確定する第22の手順
と、で実行することを特徴とする。
Further, the eleventh procedure is performed for each horizontal line in the same label area in the image within a range excluding pixels inside the area by a preset pixel width from both left and right ends of the area. An eighteenth procedure for calculating the average value of the luminance values, and in the same label area in the image, the vertical distribution of the average luminance value for each horizontal line obtained in the eighteenth procedure is examined, and the same label area is determined. A nineteenth procedure for extracting a region on a plurality of connected horizontal lines in which the average luminance value of each horizontal line is locally higher by a predetermined value compared with the peripheral portion, and The vertical gradient value of the average luminance value for each horizontal line determined in the eighteenth step at the upper and lower ends of the region for each of the plurality of connected horizontal lines determined in the nineteenth step is determined in advance for both upper and lower ends. If it is larger than the set value, A twentieth procedure for determining the line area as a high-brightness character area, and, within the same label area in the image, examining the vertical distribution of the average luminance value for each horizontal line obtained in the eighteenth procedure, A twenty-first procedure for extracting an area on a plurality of connected horizontal lines in which the average luminance value of each horizontal line is locally lower than a peripheral part by a predetermined value in the label area, and the same label in the image Within the region, the vertical gradient values of the average luminance value for each horizontal line determined in the eighteenth step at the upper and lower ends of the region on the plurality of connected horizontal lines determined in the twenty-first step are the upper and lower ends. When both are larger than a preset value, the connection horizontal line area is determined as a low-luminance character area, and a twenty-second procedure is performed.

【0020】また、前記の映像中文字領域抽出方法にお
ける手順を、コンピュータに実行させるプログラムとし
て該コンピュータが読み取り可能な記録媒体に記録した
ことを特徴とする。
Further, the procedure in the above-described method of extracting a character region in a video is recorded on a computer-readable recording medium as a program to be executed by a computer.

【0021】前記のとおり、NTSC形式の映像中のカ
ラー画像は、水平ライン方向に色の滲みが生じ、テロッ
プなどの文字部に関しても色劣化が生じる。ただし、色
劣化した場合でも一つの水平ライン上の輝度分布だけを
調べると、文字内の輝度の変化は小さく、文字と背景の
間のコントラストは高い場合が多いという性質をもつ。
図10は色劣化文字中のある走査線上の輝度分布の一例
を示した図であり、文字内で色劣化が生じてもある水平
ライン上の輝度分布には、文字内の高コントラスト部は
含まず、色劣化部も周囲の背景部とは十分に輝度の差が
存在するという特徴を持つことを示す。そこで、本発明
では、画像中の水平ライン単位で局所的に輝度値が高い
連結画素、あるいは局所的に輝度値が低い連結画素を文
字領域とすることにより、従来手法では困難であった高
輝度文字内の色劣化部を抽出することを可能とする。更
に、領域境界部での輝度勾配の勾配の絶対値が大きい場
合のみ文字領域として確定することにより、従来手法の
問題点であった周囲とのコントラストが低い領域の抽出
を抑制することを可能とする。図11に、本発明により
図12の画像から文字領域抽出を行った結果を、図14
の従来技術による抽出結果と対比させて示す。
As described above, in a color image in an NTSC format video, color bleeding occurs in the horizontal line direction, and color degradation also occurs in a character portion such as a telop. However, when only the luminance distribution on one horizontal line is examined even when the color is deteriorated, the change in the luminance in the character is small, and the contrast between the character and the background is often high.
FIG. 10 is a diagram illustrating an example of a luminance distribution on a certain scanning line in a color-deteriorated character. The luminance distribution on a horizontal line where color deterioration occurs in the character includes a high-contrast part in the character. In other words, it shows that the color degraded portion also has a feature that there is a sufficient difference in luminance from the surrounding background portion. Therefore, in the present invention, by setting a connected pixel having a locally high brightness value or a locally connected pixel having a low brightness value in a horizontal line unit in an image as a character area, high brightness which is difficult with the conventional method is obtained. It is possible to extract a color deteriorated portion in a character. Further, by determining the character area only when the absolute value of the luminance gradient at the area boundary is large, it is possible to suppress the extraction of an area having low contrast with the surrounding area, which is a problem of the conventional method. I do. FIG. 11 shows the result of character region extraction from the image of FIG.
This is shown in comparison with the result of extraction according to the prior art.

【0022】[0022]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0023】図1は、本発明の一実施形態例による装置
の構成とともに処理の流れを示すブロック図である。
FIG. 1 is a block diagram showing the configuration and processing flow of an apparatus according to an embodiment of the present invention.

【0024】図1において、1はカラー動画像入力記憶
手段であり、処理対象の文字が表示されているカラー画
像データを、指定した複数枚入力してメモリに記憶す
る。
In FIG. 1, reference numeral 1 designates a color moving image input storage means for inputting a plurality of designated color image data in which characters to be processed are displayed and storing them in a memory.

【0025】2は複数フレーム平均化部であり、カラー
動画像入力記憶手段1により入力された複数の画像間で
位置の対応する画素同士のRGB各成分の平均値を各画
素の値として持つ平均値カラー画像を作成する。
Reference numeral 2 denotes a plurality of frame averaging unit, which has an average value of RGB components of pixels corresponding to positions among a plurality of images input by the color moving image input storage means 1 as a value of each pixel. Create a value color image.

【0026】3は輝度値類似領域形成部であり、複数フ
レーム平均化部2により得られた平均値カラー画像中で
輝度値が類似し、画像空間内で隣接する複数の画素同士
を連結領域として形成する。
Reference numeral 3 denotes a luminance value similar region forming unit which uses a plurality of pixels having similar luminance values in the average color image obtained by the plural frame averaging unit 2 and adjacent pixels in the image space as a connection region. Form.

【0027】4は彩度値類似領域形成部であり、輝度値
類似領域形成部3により得られた輝度値が類似する連結
領域画像中の各領域内で彩度値が類似し、画像空間内で
隣接する複数の画素同士を連結領域として形成する。
Reference numeral 4 denotes a saturation value similar area forming unit which has similar saturation values in the respective regions in the connected area image having similar luminance values obtained by the luminance value similar area forming unit 3, To form a plurality of adjacent pixels as a connection region.

【0028】5は色相値類似領域形成部であり、彩度値
類似領域形成部4により得られた輝度値、彩度値共に類
似する連結領域画像に対し、各領域内で色相値が類似
し、画素空間内で隣接する複数の画素を連結領域として
形成する。
Reference numeral 5 denotes a hue value similar region forming unit which has similar hue values in each region with respect to the connected region image obtained by the saturation value similar region forming unit 4 and having similar luminance values and saturation values. A plurality of pixels adjacent in the pixel space are formed as a connection region.

【0029】6は背景領域除去部であり、色相値類似領
域形成部5により得られた輝度値、彩度値、色相値共に
類似する画像中の連結領域に対し、文字領域特徴を満た
さない連結領域を除去する。
Reference numeral 6 denotes a background region removing unit which connects a connected region in the image having similar luminance values, saturation values, and hue values obtained by the hue value similar region forming unit 5 without satisfying the character region characteristics. Remove the area.

【0030】7は文字領域画像蓄積部であり、背景領域
除去部6により得られた文字領域抽出結果画像を蓄積す
る。
Reference numeral 7 denotes a character area image storage unit, which stores the character area extraction result image obtained by the background area removal unit 6.

【0031】8は処理制御部であり、上記1〜7の各部
の実行を制御する。
Reference numeral 8 denotes a processing control unit which controls the execution of each of the above-mentioned units 1 to 7.

【0032】図2は、図1中の輝度値類似領域形成部3
の構成の一例とともに処理の流れの一例を示すブロック
図である。
FIG. 2 is a diagram showing a luminance value similar area forming unit 3 in FIG.
FIG. 3 is a block diagram showing an example of a processing flow together with an example of the configuration of FIG.

【0033】図2において、9は水平ライン単位二値化
部であり、画像中の各水平ライン内で輝度の二値化を行
い、各水平ライン毎の二値結果を統合することにより仮
の文字領域を抽出する。
In FIG. 2, reference numeral 9 denotes a horizontal line unit binarizing unit, which binarizes the luminance within each horizontal line in the image, and integrates the binary results for each horizontal line to create a provisional image. Extract the character area.

【0034】10は二値化結果ラベリング部であり、水
平ライン単位二値化部9により得られた仮の文字領域画
像中の各領域毎に、通し番号をラベルとして付与するラ
ベリング処理を行う。
Reference numeral 10 denotes a binarization result labeling unit, which performs a labeling process for assigning a serial number as a label to each area in the provisional character area image obtained by the horizontal line unit binarization unit 9.

【0035】11は輝度類似文字領域確定部であり、二
値化結果ラベリング部10により得られたラベル画像中
の同一ラベルが付与された仮の文字領域内で垂直方向の
輝度分布を二値化することで仮の文字領域中の文字領域
画素を確定する。
Reference numeral 11 denotes a luminance-similar character area determining unit which binarizes the luminance distribution in the vertical direction in a temporary character area to which the same label is added in the label image obtained by the binarization result labeling unit 10. By doing so, the character area pixels in the temporary character area are determined.

【0036】12は処理制御部であり、上記9〜11の
各部の実行を制御する。また、2,3,4はそれぞれ図
1中の同番号の部分と同一である。
Reference numeral 12 denotes a processing control unit, which controls the execution of each of the units 9 to 11 described above. Also, 2, 3, and 4 are the same as the same-numbered portions in FIG.

【0037】図3は、図2中の水平ライン単位二値化部
9の構成の一例とともに処理の流れの一例を示すブロッ
ク図である。
FIG. 3 is a block diagram showing an example of the processing flow along with an example of the configuration of the horizontal line unit binarizing section 9 in FIG.

【0038】図3において、13は水平ライン上輝度極
大値領域検出部であり、画像中のある水平ライン内の輝
度分布を調べ、該水平ライン内で局所的に輝度値が予め
設定した値だけ高い連結画素領域を抽出する。
In FIG. 3, reference numeral 13 denotes a luminance maximum value area detection unit on a horizontal line, which examines the luminance distribution in a certain horizontal line in the image, and determines the luminance value locally within the horizontal line by a preset value. A high connected pixel area is extracted.

【0039】14は仮高輝度文字領域抽出部であり、画
像中のある水平ライン上で、水平ライン上輝度極大値領
域検出部13により得られた連結画素領域の左右の両端
における水平方向の輝度勾配の絶対値が左右の両端とも
予め設定した値よりも大きい場合、該連結画素領域を仮
の高輝度文字領域とする。
Reference numeral 14 denotes a provisional high-luminance character area extracting unit which outputs a horizontal luminance at both left and right ends of a connected pixel area obtained by a horizontal-line maximum luminance area detecting unit 13 on a certain horizontal line in the image. If the absolute value of the gradient is greater than a preset value at both the left and right ends, the connected pixel area is set as a temporary high-luminance character area.

【0040】15は水平ライン上輝度極小値領域検出部
であり、画像中のある水平ライン内の輝度分布を調べ、
該水平ライン内で局所的に輝度値が予め設定した値だけ
低い連結画素領域を抽出する。
Numeral 15 is a luminance minimum value area detecting unit on the horizontal line, which examines the luminance distribution in a certain horizontal line in the image.
A connected pixel region whose luminance value is locally lower by a preset value is extracted locally in the horizontal line.

【0041】16は仮低輝度文字領域抽出部であり、画
像中のある水平ライン上で、水平ライン上輝度極小値領
域検出部15により得られた連結画素領域の左右の両端
における水平方向の輝度勾配の絶対値が左右の両端とも
予め設定した値よりも大きい場合、該連結画素領域を仮
の低輝度文字領域とする。
Reference numeral 16 denotes a provisional low-luminance character area extraction unit which outputs a horizontal luminance at both left and right ends of a connected pixel area obtained by a horizontal minimum luminance area detection unit 15 on a certain horizontal line in the image. If the absolute value of the gradient is larger than the preset value at both the left and right ends, the connected pixel area is set as a temporary low-luminance character area.

【0042】17は処理制御部であり、13〜16の処
理部における実行を制御する。
Reference numeral 17 denotes a processing control unit, which controls execution in the processing units 13 to 16.

【0043】図4は、図2中の輝度類似文字領域確定部
11の構成の一例とともに処理の流れの一例を示すブロ
ック図である。
FIG. 4 is a block diagram showing an example of the flow of processing along with an example of the configuration of the luminance similar character area determination section 11 in FIG.

【0044】図4において、18は水平ライン輝度平均
値算出部であり、画像中の同一ラベル領域内の各水平ラ
イン毎に該領域の左右の両端の部分から予め設定した画
素幅だけ内側の画素を除いた範囲で輝度値の平均値を算
出する。
In FIG. 4, reference numeral 18 denotes a horizontal line luminance average value calculation unit, and for each horizontal line in the same label area in the image, pixels inside a predetermined pixel width from the left and right ends of the area are set. The average of the luminance values is calculated in a range excluding.

【0045】19は垂直方向輝度極大水平ライン領域検
出部であり、水平ライン輝度平均値算出部18で求めた
各水平ライン上の輝度平均値の垂直方向の分布を調べ、
該領域内で局所的に輝度値が予め設定した値だけ高い連
結する複数の水平ライン上の領域を抽出する。
Reference numeral 19 denotes a vertical luminance maximum horizontal line area detecting unit which checks the vertical distribution of the average luminance value on each horizontal line obtained by the horizontal line average luminance value calculating unit 18.
A region on a plurality of connected horizontal lines whose luminance value is locally higher by a preset value is extracted in the region.

【0046】20は高輝度文字領域確定部であり、垂直
方向輝度極大水平ライン領域検出部19で求めた同一ラ
ベル領域内の連結する複数の水平ライン上の領域の上下
の両端部における水平ライン輝度平均算出部18で求め
た水平ライン毎の輝度平均値の垂直方向の勾配値が上下
の両端とも予め設定した値よりも大きい場合、該連結水
平ライン領域を高輝度文字領域として確定する。
Reference numeral 20 denotes a high-brightness character area determination unit, which is the horizontal line brightness at the upper and lower ends of a plurality of connected horizontal lines in the same label area obtained by the vertical brightness maximum horizontal line area detection unit 19. When the vertical gradient value of the luminance average value for each horizontal line obtained by the average calculation unit 18 is larger than a preset value at both upper and lower ends, the connected horizontal line area is determined as a high luminance character area.

【0047】21は垂直方向輝度極小水平ライン領域検
出部であり、水平ライン輝度平均値算出部18で求めた
各水平ライン上の輝度平均値の垂直方向の分布を調べ、
該領域内で局所的に輝度値が予め設定した値だけ低い連
結する複数の水平ライン上の領域を抽出する。
Numeral 21 denotes a vertical direction minimum luminance horizontal line area detecting section for examining the vertical distribution of the average luminance value on each horizontal line obtained by the horizontal line average luminance value calculating section 18.
A region on a plurality of connected horizontal lines whose luminance value is locally lower by a preset value is extracted in the region.

【0048】22は低輝度文字領域確定部であり、垂直
方向輝度極小水平ライン領域検出部19で求めた同一ラ
ベル領域内の連結する複数の水平ライン上の領域の上下
の両端部における水平ライン輝度平均算出部18で求め
た水平ライン毎の輝度平均値の垂直方向の勾配値が上下
の両端とも予め設定した値よりも大きい場合、該連結水
平ライン領域を低輝度文字領域として確定する。
Reference numeral 22 denotes a low-luminance character area determination unit, which is the horizontal line luminance at the upper and lower ends of a plurality of connected horizontal lines in the same label area obtained by the vertical luminance minimum horizontal line area detection unit 19. If the vertical gradient value of the luminance average value for each horizontal line obtained by the average calculation unit 18 is greater than a preset value at both upper and lower ends, the connected horizontal line area is determined as a low luminance character area.

【0049】23は処理制御部であり、18〜22の各
部における実行を制御する。
Reference numeral 23 denotes a processing control unit which controls the execution of each of the units 18 to 22.

【0050】図5は、図2中の水平ライン単位輝度二値
化部9の処理の実施形態を説明するためのフローチャー
トである。
FIG. 5 is a flowchart for explaining an embodiment of the processing of the horizontal line unit luminance binarizing section 9 in FIG.

【0051】図5において、ステップ(30)は輝度値
画像をメモリに読み込む過程である。
In FIG. 5, step (30) is a process of reading the luminance value image into the memory.

【0052】ステップ(31)は、ステップ(30)で
メモリに読み込まれた輝度画像を水平ライン単位に分割
する過程である。
Step (31) is a process of dividing the luminance image read into the memory in step (30) into horizontal lines.

【0053】ステップ(32)は、輝度類似文字領域確
定処理の未処理の水平ラインが存在するかどうかを判断
する過程であり、未処理の水平ラインが存在すれば、ス
テップ(33)へ移り、未処理の水平ラインが存在しな
ければ、処理を終了する。
Step (32) is a step of judging whether or not there is an unprocessed horizontal line in the luminance similar character area determination processing. If there is an unprocessed horizontal line, the process proceeds to step (33). If there is no unprocessed horizontal line, the process ends.

【0054】ステップ(33)は、ステップ(31)で
得られた画像中の各水平ライン上毎に輝度分布を調べ、
極大値を持つ画素を全て求める過程である。
In a step (33), a luminance distribution is examined for each horizontal line in the image obtained in the step (31).
This is a process of obtaining all the pixels having the maximum value.

【0055】ステップ(34)は、ステップ(31)で
得られた画像中の各水平ライン上毎に輝度分布を調べ、
極小値を持つ画素を全て求める過程である。
In a step (34), a luminance distribution is checked for each horizontal line in the image obtained in the step (31).
This is a process of obtaining all the pixels having the minimum value.

【0056】ステップ(35)は、ステップ(33)で
得られた極大値画素のうち、仮の高輝度文字領域抽出処
理の未処理の極大値画素が存在するかどうかを判断する
過程であり、未処理の極大値画素が存在すれば、ステッ
プ(36)へ移り、未処理の極大値画素が存在しなけれ
ば、ステップ(39)へ移る。
Step (35) is a step of judging whether or not there is an unprocessed maximum pixel in the provisional high-brightness character region extraction processing among the maximum pixels obtained in step (33). If there is an unprocessed local maximum pixel, the process proceeds to step (36). If there is no unprocessed local maximum pixel, the process proceeds to step (39).

【0057】ステップ(36)は、ステップ(33)で
得られた極大値画素を開始点とし、左方向、及び右方向
に水平ライン上を一画素づつ走査し、極大値画素よりも
左側、右側でそれぞれ極大値より予め設定した閾値だけ
輝度値が低い最初の画素を検出し、検出された2つの画
素と該水平ライン上でそれら2つの画素の間に存在する
画素を連結画素領域として抽出する過程である。
In step (36), starting from the maximum value pixel obtained in step (33) as a starting point, the horizontal line is scanned one pixel at a time in the left and right directions, and left and right sides of the maximum value pixel. Detects the first pixel whose luminance value is lower than the maximum value by a preset threshold value, and extracts the two detected pixels and the pixel existing between the two pixels on the horizontal line as a connected pixel area. It is a process.

【0058】ステップ(37)は、ステップ(36)で
得られた水平ライン上の連結画素領域の左右の両端部に
おける水平方向の輝度勾配の絶対値が、左右両方とも予
め設定した閾値よりも大きいかどうか判断する過程であ
り、大きいと判断された場合、ステップ(38)へ移
り、大きくないと判断された場合、ステップ(35)へ
移る。
In step (37), the absolute value of the luminance gradient in the horizontal direction at both the left and right ends of the connected pixel area on the horizontal line obtained in step (36) is larger than the preset threshold value in both the left and right directions. The process proceeds to step (38) if it is determined to be large, and to step (35) if not.

【0059】ステップ(38)は、ステップ(36)で
得られた水平ライン上の連結画素領域を仮の高輝度文字
領域として抽出する過程であり、処理後はステップ(3
5)へ移る。
Step (38) is a process in which the connected pixel area on the horizontal line obtained in step (36) is extracted as a temporary high-luminance character area.
Move to 5).

【0060】図6は、ステップ(36)、ステップ(3
7)、ステップ(38)を説明するための図であり、あ
る水平ライン上の極大輝度値画素1〜4について、仮の
高輝度文字領域が抽出されるかどうかを示す。極大輝度
値画素1,3は、左右の画素との輝度差、輝度勾配とも
条件を満たすため仮の高輝度文字領域として抽出される
が、極大輝度値画素2,4は条件をみたさないため、抽
出されない。
FIG. 6 shows steps (36) and (3).
7) is a diagram for explaining step (38), and shows whether or not a temporary high-luminance character region is extracted for the maximum luminance value pixels 1 to 4 on a certain horizontal line. The maximum luminance value pixels 1 and 3 are extracted as a provisional high luminance character area because both the luminance difference and the luminance gradient from the left and right pixels satisfy the conditions, but the maximum luminance value pixels 2 and 4 do not satisfy the conditions. Not extracted.

【0061】ステップ(39)は、ステップ(34)で
得られた極小値画素のうち、仮の低輝度文字領域抽出処
理の未処理の極小値画素が存在するかどうかを判断する
過程であり、未処理の極小値画素が存在すれば、ステッ
プ(40)へ移り、未処理の極小値画素が存在しなけれ
ば、ステップ(32)へ移る。
Step (39) is a step of judging whether or not there is an unprocessed minimum-value pixel in the provisional low-luminance character region extraction processing among the minimum-value pixels obtained in step (34). If there is an unprocessed minimal value pixel, the process proceeds to step (40). If there is no unprocessed minimal value pixel, the process proceeds to step (32).

【0062】ステップ(40)は、ステップ(34)で
得られた極小値画素を開始点とし、左方向、及び右方向
に水平ライン上を一画素づつ走査し、極小値画素よりも
左側、右側でそれぞれ極小値より予め設定した閾値だけ
輝度値が高い最初の画素を検出し、検出された2つの画
素と該水平ライン上でそれら2つの画素の間に存在する
画素を連結画素領域として抽出する過程である。
In step (40), starting from the minimum value pixel obtained in step (34) as a starting point, the horizontal line is scanned left and right one pixel at a time, and the left and right sides of the minimum value pixel are scanned. Detects the first pixel having a luminance value higher than the minimum value by a preset threshold value, and extracts the detected two pixels and the pixel existing between the two pixels on the horizontal line as a connected pixel area. It is a process.

【0063】ステップ(41)は、ステップ(40)で
得られた水平ライン上の連結画素領域の左右の両端部に
おける水平方向の輝度勾配の絶対値が、左右両方とも予
め設定した閾値よりも大きいかどうか判断する過程であ
り、大きいと判断された場合、ステップ(42)へ移
り、大きくないと判断された場合、ステップ(39)へ
移る。
In step (41), the absolute value of the luminance gradient in the horizontal direction at both the left and right ends of the connected pixel area on the horizontal line obtained in step (40) is larger than the preset threshold value on both the left and right sides. The process proceeds to step (42) if it is determined to be large, and to step (39) if it is not large.

【0064】ステップ(42)は、ステップ(40)で
得られた水平ライン上の連結画素領域を仮の低輝度文字
領域として抽出する過程であり、処理後はステップ(3
9)へ移る。
Step (42) is a process of extracting the connected pixel area on the horizontal line obtained in step (40) as a temporary low-luminance character area.
Move to 9).

【0065】図7は、図2中の輝度類似文字領域確定部
11の処理の実施形態を説明するためのフローチャート
である。
FIG. 7 is a flowchart for explaining an embodiment of the processing of the luminance similar character area determination section 11 in FIG.

【0066】図7において、ステップ(51)は、輝度
値画像、及び仮高輝度文字領域画像をメモリに読み込む
過程である。
In FIG. 7, step (51) is a process of reading the luminance value image and the temporary high luminance character area image into the memory.

【0067】ステップ(52)は、高輝度文字領域確定
処理の未処理の仮高輝度領域が存在するかどうか判断す
る過程であり、未処理の仮高輝度領域が存在すれば、ス
テップ(53)へ移り、未処理の仮高輝度領域が存在し
なければ、ステップ(59)へ移る。
Step (52) is a step of judging whether or not there is an unprocessed provisional high-luminance area in the high-luminance character area determination processing. If there is an unprocessed provisional high-luminance area, step (53) is performed. Then, if there is no unprocessed provisional high-luminance area, go to step (59).

【0068】ステップ(53)は、仮高輝度文字領域画
像中の同一ラベル領域内の各水平ライン毎に該領域の左
右の両端の部分から予め設定した画素幅だけ内側の画素
を除いた範囲で輝度値の平均値を算出する過程である。
The step (53) is performed for each horizontal line in the same label area in the provisional high-brightness character area image within a range excluding pixels inside by a preset pixel width from both left and right ends of the area. This is the process of calculating the average of the brightness values.

【0069】ステップ(54)は、画像中の同一ラベル
領域内でステップ(53)で求めた各水平ライン毎の輝
度値の平均値を垂直方向に調べ、極大値となる輝度平均
値を持つ水平ラインを全て検出する過程である。
In the step (54), the average value of the luminance values for each horizontal line obtained in the step (53) in the same label area in the image is examined in the vertical direction, and the horizontal value having the maximum luminance value is determined. This is the process of detecting all the lines.

【0070】ステップ(55)は、高輝度文字領域確定
処理の未処理の極大輝度水平ラインが存在するかどうか
判断する過程であり、未処理の極大輝度水平ラインが存
在すれば、ステップ(56)に移り、未処理の極大輝度
水平ラインが存在しなければ、ステップ(52)に移
る。
Step (55) is a step of judging whether or not there is an unprocessed maximum luminance horizontal line in the high luminance character area determination processing. If there is an unprocessed maximum luminance horizontal line, step (56) is performed. If there is no unprocessed maximum luminance horizontal line, the process proceeds to step (52).

【0071】ステップ(56)は、ステップ(54)で
得られた極大輝度水平ラインを開始ラインとし、上方
向、及び下方向に同一ラベル領域内を一水平ラインずつ
参照し、開始ラインよりも上側、下側でそれぞれ開始ラ
インの輝度平均値より予め設定した閾値だけ低い輝度平
均値を持つ最初の水平ラインを検出し、検出された2つ
の水平ライン上の画素と該同一ラベル領域内でそれら2
つの水平ラインの間に存在する水平ライン上の画素を統
合し、連結画素領域として抽出する過程である。このと
き、2つの水平ラインが検出される前に同一ラベル領域
の上端部、あるいは下端部の水平ラインに到達した場合
は、該水平ラインを連結画素領域の上端、あるいは下端
として検出する。
In step (56), the maximum brightness horizontal line obtained in step (54) is used as a start line, and the same label area is referred to one horizontal line at a time in the upward and downward directions. , The first horizontal line having a lower luminance average value by a preset threshold value than the luminance average value of the start line on the lower side is detected, and the pixels on the two detected horizontal lines and the two pixels within the same label area are detected.
In this process, pixels on a horizontal line existing between two horizontal lines are integrated and extracted as a connected pixel region. At this time, if the horizontal line at the upper end or the lower end of the same label area is reached before two horizontal lines are detected, the horizontal line is detected as the upper or lower end of the connected pixel area.

【0072】ステップ(57)は、ステップ(56)で
抽出した連結画素領域の上下の両端部において、垂直方
向の輝度勾配値の絶対値が予め設定した閾値より大きい
かどうか判断する過程であり、大きいと判断された場
合、ステップ(58)に移り、大きくないと判断された
場合、ステップ(55)に移る。
Step (57) is a step of judging whether the absolute value of the vertical luminance gradient value is greater than a predetermined threshold value at the upper and lower ends of the connected pixel area extracted in step (56), If it is determined that it is larger, the process proceeds to step (58). If it is determined that it is not larger, the process proceeds to step (55).

【0073】ステップ(58)は、ステップ(57)で
求めた上下の両端部における垂直方向の輝度勾配の絶対
値が、上下とも予め設定した閾値よりも大きい場合、該
連結画素領域を高輝度文字領域として確定する過程であ
る。
In step (58), if the absolute value of the vertical luminance gradient at both the upper and lower ends obtained in step (57) is larger than a predetermined threshold value in both the upper and lower directions, the connected pixel area is set to a high-luminance character. This is the process of determining the area.

【0074】図8、図9は、ステップ(53),(5
6),(57),(58)を説明する図であり、図8で
は、黒い背景中に白い「雪」という文字が左右の両端部
で色劣化が生じ、表示されている例を用いる。水平ライ
ン毎に両端部の画素を除いた範囲で輝度の平均値を求め
ると、色劣化部を除いた値が得られることを示す。図9
では、「電」という文字の上にノイズ領域が統合されて
いる例を用いる。各水平ライン毎の輝度平均値を垂直方
向の分布から極大値を検出し、上部、下部に一定値だけ
輝度値が下がる水平ラインを検出すると「電」という文
字とノイズ領域が分離できる。
FIGS. 8 and 9 show steps (53) and (5).
FIG. 8 is a diagram for explaining (6), (57), and (58). FIG. 8 uses an example in which white “snow” is displayed on a black background with color deterioration at both left and right ends and displayed. Obtaining the average value of the luminance in a range excluding the pixels at both ends for each horizontal line indicates that a value excluding the color deterioration portion can be obtained. FIG.
In this example, an example in which a noise region is integrated on the character “den” will be used. The maximum value of the average luminance value of each horizontal line is detected from the distribution in the vertical direction, and when a horizontal line in which the luminance value decreases by a certain value in the upper and lower parts is detected, the character "den" can be separated from the noise region.

【0075】ステップ(59)は、仮低輝度文字領域画
像をメモリに読み込む過程である。
Step (59) is a process of reading the temporary low-luminance character area image into the memory.

【0076】ステップ(60)は、低輝度文字領域確定
処理の未処理の仮低輝度領域が存在するかどうか判断す
る過程であり、未処理の仮低輝度領域が存在すれば、ス
テップ(61)へ移り、未処理の仮高輝度領域が存在し
なければ輝度類似文字領域確定部の処理を終了する。
Step (60) is a step of judging whether or not there is an unprocessed temporary low-luminance area in the low-luminance character area determination processing. If there is an unprocessed temporary low-luminance area, step (61) is performed. Then, if there is no unprocessed provisional high luminance area, the processing of the luminance similar character area determination unit is terminated.

【0077】ステップ(61)は、仮低輝度文字領域画
像中の同一ラベル領域内の各水平ライン毎に該領域の左
右の両端の部分から予め設定した画素幅だけ内側の画素
を除いた範囲で輝度値の平均値を算出する過程である。
The step (61) is performed for each horizontal line in the same label area in the provisional low-luminance character area image in a range excluding pixels inside by a predetermined pixel width from both left and right ends of the area. This is the process of calculating the average of the brightness values.

【0078】ステップ(62)は、画像中の同一ラベル
領域内でステップ(61)で求めた各水平ライン毎の輝
度値の平均値を垂直方向に調べ、極小値となる輝度平均
値を持つ水平ラインを全て検出する過程である。
In the step (62), the average value of the luminance values for each horizontal line obtained in the step (61) in the same label area in the image is examined in the vertical direction, and the horizontal value having the minimum luminance value is determined. This is the process of detecting all the lines.

【0079】ステップ(63)は低輝度文字領域確定処
理の未処理の極小輝度水平ラインが存在するかどうか判
断する過程であり、未処理の極小輝度水平ラインが存在
すれば、ステップ(64)に移り、未処理の極小輝度水
平ラインが存在しなければ、ステップ(60)に移る。
Step (63) is a step of judging whether or not there is an unprocessed minimal luminance horizontal line in the low luminance character area determination processing. If there is an unprocessed minimal luminance horizontal line, the process proceeds to step (64). If there is no unprocessed minimum luminance horizontal line, the process proceeds to step (60).

【0080】ステップ(64)は、ステップ(62)で
得られた極小輝度水平ラインを開始ラインとし、上方
向、及び下方向に同一ラベル領域内を一水平ラインずつ
参照し、開始ラインよりも上側、下側でそれぞれ開始ラ
インの輝度平均値より予め設定した閾値だけ高い輝度平
均値を持つ最初の水平ラインを検出し、検出された2つ
の水平ライン上の画素と該同一ラベル領域内でそれら2
つの水平ラインの間に存在する水平ライン上の画素を統
合し、連結画素領域として抽出する過程である。このと
き、2つの水平ラインが検出される前に同一ラベル領域
の上端部、あるいは下端部の水平ラインに到達した場合
は、該水平ラインを連結画素領域の上端、あるいは下端
として検出する。
In the step (64), the minimum luminance horizontal line obtained in the step (62) is set as a start line, and the same label area is referred to one horizontal line at a time in an upward direction and a downward direction. , The first horizontal line having a luminance average value higher than the luminance average value of the start line by a preset threshold value on the lower side is detected, and the pixels on the two detected horizontal lines and the two pixels within the same label area are detected.
In this process, pixels on a horizontal line existing between two horizontal lines are integrated and extracted as a connected pixel region. At this time, if the horizontal line at the upper end or the lower end of the same label area is reached before two horizontal lines are detected, the horizontal line is detected as the upper or lower end of the connected pixel area.

【0081】ステップ(65)は、ステップ(64)で
抽出した連結画素領域の上下の両端部において、垂直方
向の輝度勾配値の絶対値が予め設定した閾値より大きい
かどうか判断する過程であり、大きいと判断された場
合、ステップ(66)に移り、大きくないと判断された
場合、ステップ(63)に移る。
Step (65) is a step of judging whether the absolute value of the vertical luminance gradient value is greater than a preset threshold value at the upper and lower ends of the connected pixel area extracted in step (64), If it is determined that it is larger, the process proceeds to step (66), and if it is determined that it is not larger, the process proceeds to step (63).

【0082】ステップ(66)は、ステップ(65)で
求めた上下の両端部における垂直方向の輝度勾配の絶対
値が、上下とも予め設定した閾値よりも大きい場合、該
連結画素領域を低輝度文字領域として確定する過程であ
る。
In step (66), when the absolute value of the vertical luminance gradient at both the upper and lower ends obtained in step (65) is larger than a predetermined threshold value in both the upper and lower parts, the connected pixel area is set to a low-luminance character. This is the process of determining the area.

【0083】なお本発明は、記録媒体を読み取るための
読取装置と、文字認識対象のカラー画像や記録媒体から
読み取ったプログラム、抽出された文字領域画像等を格
納しそれを自由に読み出し可能なメモリ装置と、各種の
処理を行う際に必要なデータを保持するためのバッファ
やそれに準ずる装置と、その処理の過程で必要な情報を
表示したりカラー画像や文字認識結果等をモニタしたり
するためのディスプレイなどの出力装置と、必要な指示
を与えるためのキーボードやマウスなどの入力装置とを
備え、それらのメモリ装置、バッファ、出力装置及び入
力装置などを上記プログラムによって予め定められた手
順に基いて制御するコンピュータやそれに準ずる装置に
より、図1〜図9を用いて説明した本発明の実施形態例
の各部での処理の手順ないしアルゴリズムを適宜、実行
することが可能であり、その手順ないしアルゴリズムを
コンピュータ等に実行させるためのプログラムを上記読
取装置が読み取り可能な記録媒体、例えばフロッピーデ
ィスクやメモリカード、MO、CD、DVDなどに記録
して配布することが可能である。
The present invention relates to a reading device for reading a recording medium, a memory for storing a color image to be recognized as a character, a program read from a recording medium, an extracted character area image, and the like, and capable of freely reading them. A device and a buffer for holding data necessary for performing various processes and devices similar thereto, and for displaying necessary information and monitoring color images, character recognition results, etc. in the process of the process. An output device such as a display, and input devices such as a keyboard and a mouse for giving necessary instructions are provided, and the memory device, buffer, output device, and input device are arranged in accordance with a procedure predetermined by the program. A computer or a device equivalent thereto controls the processing in each unit of the embodiment of the present invention described with reference to FIGS. The order or algorithm can be executed as appropriate, and a program for causing a computer or the like to execute the procedure or algorithm can be read by a recording medium such as a floppy disk, memory card, MO, CD, or DVD. It is possible to record it and distribute it.

【0084】[0084]

【発明の効果】以上の説明のとおり、本発明によれば、
画像中の水平ライン単位で局所的に輝度値が高い、ある
いは低い連結画素を文字領域とすることで色劣化文字の
領域抽出が可能となる。また、このとき領域境界部の輝
度勾配の絶対値が高い領域を文字領域として抽出するた
め、周囲の部分と低コントラストの領域の過剰抽出を抑
制する効果も得られる。
As described above, according to the present invention,
By setting a connected pixel having a high or low luminance value locally as a character region in units of horizontal lines in an image, it is possible to extract a region of a color-degraded character. Further, at this time, since the region where the absolute value of the luminance gradient at the region boundary is high is extracted as the character region, the effect of suppressing the excessive extraction of the surrounding region and the region with low contrast can be obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態例による映像中文字領域抽
出装置の構成とともに処理の流れを示すブロック図であ
る。
FIG. 1 is a block diagram showing a configuration and a processing flow of an apparatus for extracting a character region in a video according to an embodiment of the present invention.

【図2】図1中の輝度値類似領域形成部3の構成の一例
とともに処理の流れの一例を示すブロック図である。
FIG. 2 is a block diagram showing an example of a processing flow together with an example of a configuration of a luminance value similar area forming unit 3 in FIG. 1;

【図3】図2中の水平ライン単位二値化部9の構成の一
例とともに処理の流れの一例を示すブロック図である。
FIG. 3 is a block diagram showing an example of a processing flow together with an example of a configuration of a horizontal line unit binarizing section 9 in FIG. 2;

【図4】図2中の輝度類似文字領域確定部11の構成の
一例とともに処理の流れの一例を示すブロック図であ
る。
4 is a block diagram showing an example of a processing flow together with an example of a configuration of a luminance similar character area determination unit 11 in FIG. 2;

【図5】図2中の水平ライン単位二値化部9の処理内容
の一例を示すフローチャートである。
FIG. 5 is a flowchart showing an example of processing contents of a horizontal line unit binarization unit 9 in FIG. 2;

【図6】図2中の水平ライン単位二値化部9の処理実施
の一例を説明するための捕捉図である。
FIG. 6 is a capture diagram for explaining an example of a process performed by the horizontal line unit binarization unit 9 in FIG. 2;

【図7】図2中の輝度類似文字領域確定部11の処理内
容の一例を示すフローチャートである。
FIG. 7 is a flowchart showing an example of processing contents of a luminance similar character area determination unit 11 in FIG. 2;

【図8】図2中の輝度類似文字領域確定部11の処理実
施の一例を説明するための捕捉図(その1)である。
FIG. 8 is a capture diagram (part 1) for explaining an example of processing performed by the luminance similar character area determination unit 11 in FIG. 2;

【図9】図2中の輝度類似文字領域確定部11の処理実
施の一例を説明するための捕捉図(その2)である。
FIG. 9 is a capture diagram (part 2) for explaining an example of a process performed by the luminance similar character area determination unit 11 in FIG. 2;

【図10】色劣化文字中の、ある水平ライン上の輝度分
布の一例を示す図である。
FIG. 10 is a diagram illustrating an example of a luminance distribution on a certain horizontal line in a color-deteriorated character.

【図11】本発明により図12の色劣化画像中から文字
領域を抽出した結果を示す画像である。
FIG. 11 is an image showing a result of extracting a character area from the color-degraded image of FIG. 12 according to the present invention.

【図12】NTSC形式の映像中文字の色劣化の一例を
示す画像である。
FIG. 12 is an image showing an example of color degradation of characters in a video in NTSC format.

【図13】色劣化文字の模式図である。FIG. 13 is a schematic diagram of a color-deteriorated character.

【図14】従来手法により図12の色劣化画像中から文
字領域を抽出した結果を示す画像である。
14 is an image showing a result of extracting a character area from the color-degraded image of FIG. 12 by a conventional method.

【符号の説明】[Explanation of symbols]

1…カラー動画像入力記憶手段 2…複数フレーム平均化部 3…輝度値類似領域形成部 4…彩度値類似領域形成部 5…色相値類似領域形成部 6…背景領域除去部 7…文字領域画像蓄積部 8…処理制御部 9…水平ライン単位二値化部 10…二値化結果ラベリング部 11…輝度類似文字領域確定部 12…処理制御部 13…水平ライン上輝度極大値領域検出部 14…仮高輝度文字領域抽出部 15…水平ライン上輝度極小値領域検出部 16…仮低輝度文字領域抽出部 17…処理制御部 18…水平ライン輝度平均値算出部 19…垂直方向輝度極大水平ライン領域検出部 20…高輝度文字領域確定部 21…垂直方向輝度極小水平ライン領域検出部 22…低輝度文字領域確定部 23…処理制御部 DESCRIPTION OF SYMBOLS 1 ... Color moving image input storage means 2 ... Multiple frame averaging unit 3 ... Luminance value similar region forming unit 4 ... Saturation value similar region forming unit 5 ... Hue value similar region forming unit 6 ... Background region removing unit 7 ... Character region Image storage unit 8 Processing control unit 9 Horizontal line unit binarization unit 10 Binarization result labeling unit 11 Luminance similar character area determination unit 12 Processing control unit 13 Maximum luminance on-horizontal line area detection unit 14 ... Temporary high-brightness character region extracting unit 15... Luminance on-horizontal-minimum value region detecting unit 16... Temporary low-luminance character region extracting unit 17... Processing control unit 18... Horizontal-line luminance average calculating unit 19. Area detecting section 20: High luminance character area determining section 21: Vertical luminance minimum horizontal line area detecting section 22: Low luminance character area determining section 23: Processing control section

───────────────────────────────────────────────────── フロントページの続き (72)発明者 小倉 健司 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内 ──────────────────────────────────────────────────の Continued on the front page (72) Inventor Kenji Ogura 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 カラー動画像中の複数のフレーム画像の
中から予め決められた方法を用いて文字が表示されてい
るフレーム画像と、該フレーム画像よりも後の時刻のフ
レーム画像のうち該フレーム画像中の文字と同一の文字
が表示されているカラー画像を複数枚入力して記憶する
第1の手段と、 第1の手段により入力された複数の画像間で位置の対応
する画素同士の輝度、彩度、色相それぞれの平均値を各
画素の値として持つ平均値カラー画像を作成する第2の
手段と、 第2の手段により得られた平均値カラー画像に対して、
輝度値が類似し、画像空間内で隣接する複数の画素同士
を連結領域として形成する第3の手段と、 第3の手段により得られた輝度値が類似する連結領域画
像に対し、各領域内で彩度値が類似し、画像空間内で隣
接する複数の画素同士を連結領域として形成する第4の
手段と、 第4の手段により得られた輝度値、彩度値共に類似する
連結領域画像に対し、各領域内で色相値が類似し、画素
空間内で隣接する複数の画素を連結領域として形成する
第5の手段と、 第5の手段により得られた輝度値、彩度値、色相値共に
類似する画像中の連結領域に対し、文字領域特徴を満た
さない連結領域を除去する第6の手段と、 第6の手段により得られた連結領域画像を文字領域抽出
結果として蓄積する第7の手段と、 第1〜第7の手段の実行順序を制御する第8の手段と、 を有することを特徴とする映像中文字領域抽出装置。
1. A frame image in which characters are displayed using a predetermined method from a plurality of frame images in a color moving image, and a frame image at a time later than the frame image. First means for inputting and storing a plurality of color images in which the same characters as the characters in the image are displayed, and brightness between pixels corresponding to positions in the plurality of images input by the first means Means for creating an average color image having an average value of each pixel as a value of each pixel for each of the saturation, the hue, and the average color image obtained by the second means.
Third means for forming a plurality of pixels having similar luminance values and adjacent to each other in the image space as connected areas; and connecting area images having similar luminance values obtained by the third means, in each area. A fourth means for forming a plurality of pixels adjacent to each other in an image space as a connected area, and a connected area image having similar luminance and saturation values obtained by the fourth means. A fifth means for forming a plurality of pixels having similar hue values in each area and adjacent in a pixel space as a connected area; and a luminance value, a saturation value, and a hue value obtained by the fifth means. A sixth means for removing a connected area that does not satisfy the character area feature from a connected area in an image having similar values, and a seventh means for storing the connected area image obtained by the sixth means as a character area extraction result. Means for controlling the execution order of the first to seventh means That the eighth means, the image in the character area extraction apparatus characterized by having a.
【請求項2】 請求項1記載の映像中文字領域抽出装置
において、 カラー画像中の輝度値が類似し、画像空間内で隣接する
複数の画素同士を連結領域として形成する第3の手段
を、 画像中の各水平ライン内で輝度の二値化を行い、各水平
ライン毎の二値化結果を統合することにより仮の文字領
域を抽出する第9の手段と、 第9の手段により得られた仮の文字領域画像中の各領域
毎に、通し番号をラベルとして付与するラベリング処理
を行う第10の手段と、 第10の手段により得られたラベル画像中の同一ラベル
が付与された仮の文字領域内で垂直方向の輝度分布を二
値化することで仮の文字領域中の文字領域画素を選択す
る第11の手段と、 第9〜第11の手段の実行順序を制御する第12の手段
と、 を用いて実現することを特徴とする映像中文字領域抽出
装置。
2. The apparatus according to claim 1, further comprising a third unit that forms a plurality of pixels having similar luminance values in the color image and adjacent to each other in the image space as a connected region. Ninth means for performing binarization of luminance within each horizontal line in the image and extracting a temporary character area by integrating the binarization results for each horizontal line, and ninth means A tenth means for performing a labeling process for assigning a serial number as a label to each area in the provisional character area image, and a provisional character to which the same label is provided in the label image obtained by the tenth means. Eleventh means for selecting a character area pixel in a temporary character area by binarizing a vertical luminance distribution in the area, and twelfth means for controlling the execution order of the ninth to eleventh means And is realized by using A device for extracting character areas in video.
【請求項3】 請求項2記載の映像中文字領域抽出装置
において、 画像中の各水平ライン内で輝度の二値化を行い、仮の文
字領域を抽出する第9の手段を、 画像中のある水平ライン内の輝度分布を調べ、該水平ラ
イン内で局所的に輝度値が周辺部と比較して予め設定し
た値だけ高い範囲を連結画素領域を抽出する第13の手
段と、 画像中のある水平ライン上で、第13の手段により得ら
れた連結画素領域の左右の両端における水平方向の輝度
勾配の絶対値が左右の両端とも予め設定した値よりも大
きい場合、該連結画素領域を仮の高輝度文字領域とする
第14の手段と、 画像中のある水平ライン内の輝度分布を調べ、該水平ラ
イン内で局所的に輝度値が周辺部と比較して予め設定し
た値だけ低い範囲を連結画素領域を抽出する第15の手
段と、 画像中のある水平ライン上で、第15の手段により得ら
れた連結画素領域の左右の両端における水平方向の輝度
勾配の絶対値が左右の両端とも予め設定した値よりも大
きい場合、該連結画素領域を仮の低輝度文字領域とする
第16の手段と、 第13〜第16の手段の実行順序を制御する第17の手
段と、 を用いて実現することを特徴とする映像中文字領域抽出
装置。
3. The image character area extracting apparatus according to claim 2, wherein ninth means for binarizing the luminance within each horizontal line in the image and extracting a temporary character area is provided. A thirteenth means for examining a luminance distribution in a certain horizontal line and extracting a connected pixel region in a range where the luminance value is locally higher than a peripheral portion by a predetermined value in the horizontal line, and If the absolute value of the horizontal luminance gradient at both left and right ends of the connected pixel region obtained by the thirteenth means on a certain horizontal line is larger than a preset value at both the left and right ends, the connected pixel region is temporarily set. A fourteenth means for making a high-luminance character area, and a luminance distribution within a certain horizontal line in the image is examined, and a luminance value is locally reduced within the horizontal line by a preset value compared with the peripheral portion. 15th means for extracting a connected pixel area If the absolute value of the horizontal luminance gradient at both the left and right ends of the connected pixel area obtained by the fifteenth means on a certain horizontal line in the image is larger than a preset value at both the left and right ends, the connection is made. 16. A character area in a video, which is realized by using: a sixteenth means for setting a pixel area as a provisional low-luminance character area; and a seventeenth means for controlling the execution order of the thirteenth to sixteenth means. Extraction device.
【請求項4】 請求項2の映像中文字領域抽出装置にお
いて、 ラベル画像中の同一ラベルが付与された仮の文字領域内
で垂直方向の輝度分布を二値化することで仮の文字領域
中の文字領域画素を確定する第11の手段を、 画像中の同一ラベル領域内の各水平ライン毎に該領域の
左右の両端の部分から予め設定した画素幅だけ該領域の
内側の画素を除いた範囲で輝度値の平均値を算出する第
18の手段と、 画像中の同一ラベル領域内で、第18の手段で求めた各
水平ライン毎の輝度平均値の垂直方向の分布を調べ、該
同一ラベル領域内で局所的に水平ライン毎の平均輝度値
が周辺部と比較して予め設定した値だけ高い連結する複
数の水平ライン上の領域を抽出する第19の手段と、 画像中の同一ラベル領域内で、第19の手段で求めた連
結する複数の水平ライン毎の領域の上下の両端部におけ
る第18の手段で求めた水平ライン毎の輝度平均値の垂
直方向の勾配値が上下の両端とも予め設定した値よりも
大きい場合、該連結水平ライン領域を高輝度文字領域と
して確定する第20の手段と、 画像中の同一ラベル領域内で、第18の手段で求めた各
水平ライン毎の輝度平均値の垂直方向の分布を調べ、該
同一ラベル領域内で局所的に水平ライン毎の平均輝度値
が周辺部と比較して予め設定した値だけ低い連結する複
数の水平ライン上の領域を抽出する第21の手段と、 画像中の同一ラベル領域内で、第21の手段で求めた連
結する複数の水平ライン上の領域の上下の両端部におけ
る第18の手段で求めた水平ライン毎の輝度平均値の垂
直方向の勾配値が上下の両端とも予め設定した値よりも
大きい場合、該連結水平ライン領域を低輝度文字領域と
して確定する第22の手段と、 第18〜第22の手段の実行頂序を制御する第23の手
段と、 を用いて実現することを特徴とする映像中文字領域抽出
装置。
4. The apparatus according to claim 2, wherein the luminance distribution in the vertical direction is binarized in the temporary character area to which the same label in the label image is assigned. The eleventh means for determining a character area pixel is obtained by removing pixels inside the area by a preset pixel width from the left and right ends of the area for each horizontal line in the same label area in the image. An eighteenth means for calculating the average value of the luminance values in the range; and, in the same label area in the image, a vertical distribution of the average luminance value for each horizontal line obtained by the eighteenth means is examined. A nineteenth means for extracting a region on a plurality of connected horizontal lines in which the average luminance value of each horizontal line is locally higher than a peripheral portion by a predetermined value in the label region, and the same label in the image Within the area, the connection determined by the nineteenth means When the vertical gradient value of the average luminance value for each horizontal line obtained by the eighteenth means at both the upper and lower ends of the region for each of the plurality of horizontal lines is greater than the preset value at both the upper and lower ends, the connection horizontal A twentieth means for determining the line area as a high-brightness character area; and, in the same label area in the image, examining the vertical distribution of the average luminance value for each horizontal line obtained by the eighteenth means, A twenty-first means for extracting an area on a plurality of connected horizontal lines in which the average luminance value of each horizontal line is locally lower than a peripheral part by a preset value in the label area, and the same label in the image In the area, the vertical gradient value of the average luminance value for each horizontal line obtained by the eighteenth means at the upper and lower ends of the area on the plurality of connected horizontal lines obtained by the twenty-first means is equal to the upper and lower ends. And a preset value If the second horizontal line area is larger than the second horizontal line area, a twenty-second means for determining the connected horizontal line area as a low-luminance character area, and a twenty-third means for controlling the execution order of the eighteenth to twenty-second means are realized. A character region extracting device in a video characterized by the following.
【請求項5】 カラー動画像中の複数のフレーム画像の
中から予め決められた方法を用いて文字が表示されてい
るフレーム画像と、該フレーム画像よりも後の時刻のフ
レーム画像のうち該フレーム画像中の文字と同一の文字
が表示されているカラー画像を複数枚入力して記憶する
第1の手順と、 第1の手順により入力された複数の画像間で位置の対応
する画素同士の輝度、彩度、色相それぞれの平均値を各
画素の値として持つ平均値カラー画像を作成する第2の
手順と、 第2の手順により得られた平均値カラー画像に対して、
輝度値が類似し、画像空間内で隣接する複数の画素同士
を連結領域として形成する第3の手順と、 第3の手順により得られた輝度値が類似する連結領域画
像に対し、各領域内で彩度値が類似し、画像空間内で隣
接する複数の画素同士を連結領域として形成する第4の
手順と、 第4の手順により得られた輝度値、彩度値共に類似する
連結領域画像に対し、各領域内で色相値が類似し、画素
空間内で隣接する複数の画素を連結領域として形成する
第5の手順と、 第5の手順により得られた輝度値、彩度値、色相値共に
類似する画像中の連結領域に対し、文字領域特徴を満た
さない連結領域を除去する第6の手順と、 第6の手順により得られた連結領域画像を文字領域抽出
結果として蓄積する第7の手順と、 を有することを特徴とする映像中文字領域抽出方法。
5. A frame image in which characters are displayed by using a predetermined method from a plurality of frame images in a color moving image, and a frame image of a frame image at a time later than the frame image. A first procedure of inputting and storing a plurality of color images in which the same characters as the characters in the image are displayed, and a luminance of pixels corresponding to positions in the plurality of images input in the first procedure , A second procedure for creating an average color image having the average value of each of the saturation and the hue as the value of each pixel, and the average color image obtained by the second procedure,
A third procedure in which a plurality of pixels having similar luminance values and adjacent in the image space are formed as connected areas; and a connected area image in which the luminance values obtained in the third procedure are similar to each other, A fourth procedure of forming a plurality of pixels adjacent to each other in the image space as a connected area, and a connected area image having similar luminance and saturation values obtained by the fourth procedure. In contrast, a fifth procedure of forming a plurality of pixels having similar hue values in each area and adjacent in a pixel space as a connected area, and a luminance value, a saturation value, and a hue obtained by the fifth procedure. A sixth procedure for removing a connected area that does not satisfy the character area feature from a connected area in an image having similar values, and a seventh procedure for storing the connected area image obtained by the sixth procedure as a character area extraction result. And a video sentence comprising: Area extraction method.
【請求項6】 請求項5記載の映像中文字領域抽出方法
において、 カラー画像中の輝度値が類似し、画像空間内で隣接する
複数の画素同士を連結領域として形成する第3の手順
を、 画像中の各水平ライン内で輝度の二値化を行い、各水平
ライン毎の二値化結果を統合することにより仮の文字領
域を抽出する第9の手順と、 第9の手順により得られた仮の文字領域画像中の各領域
毎に、通し番号をラベルとして付与するラベリング処理
を行う第10の手順と、 第10の手順により得られたラベル画像中の同一ラベル
が付与された仮の文字領域内で垂直方向の輝度分布を二
値化することで仮の文字領域中の文字領域画素を選択す
る第11の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
6. The method according to claim 5, wherein a third step of forming a plurality of pixels having similar luminance values in a color image and adjacent to each other in an image space as a connected region is performed. A ninth procedure for extracting a temporary character area by binarizing the luminance within each horizontal line in the image and integrating the binarization results for each horizontal line, and a ninth procedure A tenth procedure of performing a labeling process of assigning a serial number as a label to each area in the temporary character area image, and a temporary character having the same label in the label image obtained by the tenth procedure. An eleventh procedure of selecting a character area pixel in a temporary character area by binarizing a luminance distribution in a vertical direction in the area, and a method of extracting a character area in a video image.
【請求項7】 請求項6記載の映像中文字領域抽出方法
において、 画像中の各水平ライン内で輝度の二値化を行い、仮の文
字領域を抽出する第9の手順を、 画像中のある水平ライン内の輝度分布を調べ、該水平ラ
イン内で局所的に輝度値が周辺部と比較して予め設定し
た値だけ高い範囲を連結画素領域を抽出する第13の手
順と、 画像中のある水平ライン上で、第13の手順により得ら
れた連結画素領域の左右の両端における水平方向の輝度
勾配の絶対値が左右の両端とも予め設定した値よりも大
きい場合、該連結画素領域を仮の高輝度文字領域とする
第14の手順と、 画像中のある水平ライン内の輝度分布を調べ、該水平ラ
イン内で局所的に輝度値が周辺部と比較して予め設定し
た値だけ低い範囲を連結画素領域を抽出する第15の手
順と、 画像中のある水平ライン上で、第15の手順により得ら
れた連結画素領域の左右の両端における水平方向の輝度
勾配の絶対値が左右の両端とも予め設定した値よりも大
きい場合、該連結画素領域を仮の低輝度文字領域とする
第16の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
7. A method according to claim 6, further comprising the step of: performing binarization of luminance within each horizontal line in the image to extract a temporary character region; A thirteenth procedure of examining a luminance distribution in a certain horizontal line, extracting a connected pixel area in a range where the luminance value is locally higher than a peripheral part by a predetermined value in the horizontal line, and If the absolute value of the horizontal luminance gradient at both the left and right ends of the connected pixel region obtained by the thirteenth procedure on a certain horizontal line is larger than the preset value at both the left and right ends, the connected pixel region is temporarily set. A fourteenth procedure for determining a high-luminance character area, and a luminance distribution in a certain horizontal line in the image is examined, and a luminance value is locally reduced in the horizontal line by a predetermined value in comparison with the peripheral portion. 15th procedure for extracting a connected pixel area If the absolute value of the horizontal luminance gradient at both the left and right ends of the connected pixel area obtained by the fifteenth procedure on a certain horizontal line in the image is larger than a preset value at both the left and right ends, the connection is performed. A sixteenth procedure in which a pixel area is set as a provisional low-luminance character area, and the following steps are performed.
【請求項8】 請求項6の映像中文字領域抽出方法にお
いて、 ラベル画像中の同一ラベルが付与された仮の文字領域内
で垂直方向の輝度分布を二値化することで仮の文字領域
中の文字領域画素を確定する第11の手順を、 画像中の同一ラベル領域内の各水平ライン毎に該領域の
左右の両端の部分から予め設定した画素幅だけ該領域の
内側の画素を除いた範囲で輝度値の平均値を算出する第
18の手順と、 画像中の同一ラベル領域内で、第18の手順で求めた各
水平ライン毎の輝度平均値の垂直方向の分布を調べ、該
同一ラベル領域内で局所的に水平ライン毎の平均輝度値
が周辺部と比較して予め設定した値だけ高い連結する複
数の水平ライン上の領域を抽出する第19の手順と、 画像中の同一ラベル領域内で、第19の手順で求めた連
結する複数の水平ライン毎の領域の上下の両端部におけ
る第18の手順で求めた水平ライン毎の輝度平均値の垂
直方向の勾配値が上下の両端とも予め設定した値よりも
大きい場合、該連結水平ライン領域を高輝度文字領域と
して確定する第20の手順と、 画像中の同一ラベル領域内で、第18の手順で求めた各
水平ライン毎の輝度平均値の垂直方向の分布を調べ、該
同一ラベル領域内で局所的に水平ライン毎の平均輝度値
が周辺部と比較して予め設定した値だけ低い連結する複
数の水平ライン上の領域を抽出する第21の手順と、 画像中の同一ラベル領域内で、第21の手順で求めた連
結する複数の水平ライン上の領域の上下の両端部におけ
る第18の手順で求めた水平ライン毎の輝度平均値の垂
直方向の勾配値が上下の両端とも予め設定した値よりも
大きい場合、該連結水平ライン領域を低輝度文字領域と
して確定する第22の手順と、 で実行することを特徴とする映像中文字領域抽出方法。
8. The method according to claim 6, wherein the luminance distribution in the vertical direction is binarized in a temporary character area in the label image to which the same label is assigned. The eleventh procedure for determining the character region pixels is performed by removing pixels inside the region by a preset pixel width from the left and right ends of the region for each horizontal line in the same label region in the image. An eighteenth procedure of calculating an average value of luminance values in the range; and, in the same label region in the image, examining a vertical distribution of the average luminance value of each horizontal line obtained in the eighteenth procedure, and A nineteenth procedure for extracting a region on a plurality of connected horizontal lines in which the average luminance value of each horizontal line is locally higher than a peripheral portion by a predetermined value in the label region, and the same label in the image Within the area, connect the links determined in the nineteenth procedure. If the vertical gradient value of the average luminance value of each horizontal line at the upper and lower ends of the region for each of the plurality of horizontal lines is larger than a preset value at both the upper and lower ends, the connection horizontal A twentieth procedure for determining the line area as a high-brightness character area; and, in the same label area in the image, examining the vertical distribution of the average luminance value for each horizontal line obtained in the eighteenth procedure. A twenty-first procedure for extracting a region on a plurality of connected horizontal lines in which the average luminance value for each horizontal line is locally lower by a preset value compared to the peripheral portion in the label region, and the same label in the image Within the region, the vertical gradient values of the average luminance value for each horizontal line determined in the eighteenth step at the upper and lower ends of the region on the plurality of connected horizontal lines determined in the twenty-first step are the upper and lower ends. And a preset value Again large Ri, 22 steps and, in the video in the character region extracting method characterized by performing for determining the ligation horizontal line area as a low luminance character area.
【請求項9】 請求項5から請求項8までのいずれかに
記載の映像中文字領域抽出方法における手順を、コンピ
ュータに実行させるプログラムとして該コンピュータが
読み取り可能な記録媒体に記録した、 ことを特徴とする映像中文字領域抽出方法を記録した記
録媒体。
9. A program for causing a computer to execute the method for extracting a character region in a video according to any one of claims 5 to 8, and recorded on a computer-readable recording medium. A recording medium on which a method for extracting a character area in a video is described.
JP03947198A 1997-12-04 1998-02-23 Apparatus and method for extracting character area in video and recording medium Expired - Lifetime JP3435334B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP03947198A JP3435334B2 (en) 1998-02-23 1998-02-23 Apparatus and method for extracting character area in video and recording medium
US09/204,957 US6366699B1 (en) 1997-12-04 1998-12-03 Scheme for extractions and recognitions of telop characters from video data
US09/967,431 US6501856B2 (en) 1997-12-04 2001-09-28 Scheme for extraction and recognition of telop characters from video data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03947198A JP3435334B2 (en) 1998-02-23 1998-02-23 Apparatus and method for extracting character area in video and recording medium

Publications (2)

Publication Number Publication Date
JPH11239363A true JPH11239363A (en) 1999-08-31
JP3435334B2 JP3435334B2 (en) 2003-08-11

Family

ID=12553992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03947198A Expired - Lifetime JP3435334B2 (en) 1997-12-04 1998-02-23 Apparatus and method for extracting character area in video and recording medium

Country Status (1)

Country Link
JP (1) JP3435334B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077352A1 (en) * 2003-02-25 2004-09-10 Sony Corporation Image processing device, method, and program
WO2004077354A1 (en) * 2003-02-25 2004-09-10 Sony Corporation Image processing device, method, and program
JP2007018248A (en) * 2005-07-07 2007-01-25 Sony Corp Image processor, image processing method, and program
JP2007521736A (en) * 2003-07-03 2007-08-02 松下電器産業株式会社 Video processing device, integrated circuit of video processing device, video processing method, and video processing program
JP2008234349A (en) * 2007-03-20 2008-10-02 Nippon Hoso Kyokai <Nhk> Multidimensional labeling device, multidimensional labeling system and multidimensional labeling program
US7672022B1 (en) 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672022B1 (en) 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
WO2004077352A1 (en) * 2003-02-25 2004-09-10 Sony Corporation Image processing device, method, and program
WO2004077354A1 (en) * 2003-02-25 2004-09-10 Sony Corporation Image processing device, method, and program
US7447378B2 (en) 2003-02-25 2008-11-04 Sony Corporation Image processing device, method, and program
US7593601B2 (en) 2003-02-25 2009-09-22 Sony Corporation Image processing device, method, and program
JP2007521736A (en) * 2003-07-03 2007-08-02 松下電器産業株式会社 Video processing device, integrated circuit of video processing device, video processing method, and video processing program
JP2007018248A (en) * 2005-07-07 2007-01-25 Sony Corp Image processor, image processing method, and program
JP2008234349A (en) * 2007-03-20 2008-10-02 Nippon Hoso Kyokai <Nhk> Multidimensional labeling device, multidimensional labeling system and multidimensional labeling program

Also Published As

Publication number Publication date
JP3435334B2 (en) 2003-08-11

Similar Documents

Publication Publication Date Title
US7769244B2 (en) Automatic digital film and video restoration
KR100524072B1 (en) Method for improving image quality
JPH11239363A (en) Device for extracting character area in video image, its method and medium for recording its method
JP3655110B2 (en) Video processing method and apparatus, and recording medium recording video processing procedure
US6999621B2 (en) Text discrimination method and related apparatus
US20040190788A1 (en) Image processing apparatus and method
JP3480408B2 (en) Object extraction system and method, and storage medium storing object extraction program
EP1654703B1 (en) Graphics overlay detection
JP3818044B2 (en) Noise removing apparatus, noise removing method, and computer-readable recording medium
JPH0879517A (en) Method for identifying type of image
US20080063063A1 (en) Electronic device and method for block-based image processing
JPH10285399A (en) Binarization method for image
KR100473944B1 (en) Text detecting method for digital image signal
JP7268848B2 (en) commercial detector
JP2000194851A (en) Character area extraction method and device and storage medium recording the method
JP4409713B2 (en) Document image recognition apparatus and recording medium
JP3763954B2 (en) Learning data creation method and recording medium for character recognition
KR102180478B1 (en) apparatus AND method for DETECTING CAPTION
JP3504874B2 (en) Character area determination method and apparatus, and recording medium
JP4631371B2 (en) Image processing device
JP3949954B2 (en) Dropout color identification processing program, method, and apparatus
KR100751154B1 (en) Apparatus and Method for removing mosquito noise
JP4177417B2 (en) Dropout color identification processing program, method and apparatus
JP4650958B2 (en) Image processing apparatus, method, and program
JPH03213057A (en) Picture area identifying device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term