JP2001076094A - 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 - Google Patents

文字列情報抽出装置及び方法及びその方法を記録した記録媒体

Info

Publication number
JP2001076094A
JP2001076094A JP25394499A JP25394499A JP2001076094A JP 2001076094 A JP2001076094 A JP 2001076094A JP 25394499 A JP25394499 A JP 25394499A JP 25394499 A JP25394499 A JP 25394499A JP 2001076094 A JP2001076094 A JP 2001076094A
Authority
JP
Japan
Prior art keywords
character string
character
line
edge
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25394499A
Other languages
English (en)
Other versions
JP3544324B2 (ja
Inventor
Hidekatsu Kuwano
秀豪 桑野
Yukinobu Taniguchi
行信 谷口
Haruhiko Kojima
治彦 児島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP25394499A priority Critical patent/JP3544324B2/ja
Publication of JP2001076094A publication Critical patent/JP2001076094A/ja
Application granted granted Critical
Publication of JP3544324B2 publication Critical patent/JP3544324B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字列周囲の背景中のコントラストやノイズ
の影響を抑制し、文字列の高さ・幅情報を正確に抽出で
きる文字列情報抽出装置、方法を提供する。 【解決手段】 文字を含む画像に対し、文字輪郭線検出
部2により輝度値が急変する文字輪郭線画素を検出し、
文字領域抽出部3により局所的に均一な輝度で連結する
複数画素を文字領域として抽出し、文字列矩形抽出部4
により文字列矩形抽出法等を用いて文字列を囲む矩形画
像を抽出する。文字列情報抽出部5は、この矩形画像の
中で水平方向、垂直方向の各ライン毎に、上記文字輪郭
画素の検出個数と抽出文字領域の個数を求め、両方が高
い値を取る場合にそのラインを文字列ラインとし、上記
矩形画像中で水平方向の最も上の文字列ラインと最も下
の文字列ライン、及び垂直方向の最も左の文字列ライン
と最も右の文字列ラインに囲まれる矩形を新たな文字列
矩形として抽出し、結果出力部6へ出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字列情報抽出技
術に関し、特に画像処理、パターン認識の技術を利用し
て、画像中に存在する文字列の表示位置、高さ、幅の検
出に適用して有効な技術に関するものである。
【0002】
【従来の技術】画像中の文字列の位置情報を検出する技
術に関しては、従来、下記の文献[1],[2],
[3]等で提案されている。
【0003】[1]Y.Ariki and T.Te
ranishi,“Indexing and Cla
ssification of TV NewsArt
icles Based on Telop Reco
gnition”,Proc.of 4th ICDA
R,pp.422−427,1997。
【0004】[2]Yu Zhong,Kalle K
aru,and Anli K.Jain、“Loca
ting Text in Complex Colo
rImages”,Proc.of 3rd ICDA
R,pp.146−149,1995。
【0005】[3]S.Kurakake,H.Kuw
ano,and K.Odaka、“Recognit
ion and Visual Feature Ma
tching of Text Region in
Video for Conceptual Inde
xing”,Proc.of SPIE Storag
e and Retrieval for Image
Video Database V,vol.302
2,pp.368−379,1997。
【0006】文献[1]〜[3]はそれぞれ、CDカバ
ー画像や映像中のフレーム画像等、複雑な背景中に表示
された文字列が検出対象であり、文字表示部の画像空間
内の輝度分布、及び領域抽出結果を利用した方法になっ
ている。
【0007】文献[1][2]は、画像内の文字部が周
囲の背景部との境界部に大きなコントラストを有し、文
字輪郭部からはエッジ成分が多く検出されるという特徴
に着目した方法である。画像にエッジ検出法を適用し、
エッジ画素を文字輪郭とみなし、エッジ画素を多く含む
ラインを文字列ラインとして定義し、文字列ラインが空
間的に集中している部分を文字列ライン群とし、文字列
ライン群の両端ラインを文字列の境界ラインとみなし、
高さや幅を計算している。
【0008】文献[3]は、文字領域抽出結果を利用し
た方法である。決められた方法で入力画像から二値の文
字領域画像を得る。文字領域を膨張させ、縦、あるいは
横に一定長以上の長さを持つ膨張領域に含まれる領域を
文字領域とみなし、該膨張領域を囲む矩形を文字列矩形
として抽出する。矩形の高さや幅を文字列の高さ、幅と
している。
【0009】
【発明が解決しようとする課題】しかしながら、上記文
献[1]〜[3]の従来技術とも文字以外の背景部分の
影響を十分に検討していないという問題点がある。
【0010】文献[1][2]は、文字輪郭部のコント
ラストに着目し、エッジ画素を文字輪郭とみなす方法で
あるが、文字以外の部分からもコントラストの高い部分
が存在する場合には、エッジは多数検出される。つま
り、文献[1][2]のように、エッジ検出処理で得ら
れたエッジ画素を単純にすべて文字輪郭線とみなしてし
まっては、文字の存在しない背景部に文字が存在すると
誤って判断することもあり、正確な文字列の位置を検出
することが困難である。また、映像中の文字表示に関し
ては、文字の表示効果等により文字の境界からのエッジ
が少ない場合もある。この場合も同じく、文字列ライン
の決定精度が不安定になり、文字列の高さや幅を正確に
求めることが困難となる問題点がある。
【0011】また、文献[3]では、文字領域抽出処理
の段階で、誤って抽出した背景中のノイズ領域が文字列
の周りに残る場合、膨張領域の中に背景中のノイズ領域
も含まれ、正確な文字列矩形を求めることが困難とな
り、その結果、文字列の高さや幅も正確に求まらないと
いう問題点がある。
【0012】上記のように従来の方法は、文字輪郭情
報、あるいは文字領域情報のどちらか一方にのみ着目し
ているため、背景部から受ける影響を十分に取り除くこ
とができず、文字列情報の抽出が困難な場合があった。
【0013】本発明は、従来手法で問題となった文字列
周囲の背景中のコントラストやノイズ領域の影響を極力
抑制し、正確な文字列の高さや幅の情報を抽出すること
ができる文字列情報抽出装置及び方法を提供することを
課題としている。
【0014】
【課題を解決するための手段】前記の課題を解決するた
めに、本発明による文字列情報抽出装置は、入力画像に
対して輝度値が急激に変化する画素を文字の輪郭線上の
画素として検出し、文字輪郭線画像を得る文字輪郭線検
出部と、該入力画像に対して画像内で局所的に輝度値が
均一であり連結する複数の画素を文字領域として抽出し
文字領域画像を得る文字領域抽出部と、該入力画像に対
して画像中の文字列を囲む矩形画像を抽出する文字矩形
抽出部と、該矩形画像の中で水平方向、垂直方向の各ラ
イン毎に走査し、該文字輪郭線画像から文字輪郭画素の
個数を、該文字領域画像から文字領域の個数を各ライン
毎にカウントし、該文字輪郭画素の個数及び該文字領域
の個数がともに高い値を取るラインを文字の画素を含ん
だ文字列ラインとして抽出し、該矩形画像の水平ライン
中の最も上側の文字列ライン及び最も下側の文字列ライ
ン並びに垂直方向ライン中の最も左側の文字列ライン及
び最も右側の文字列ラインに囲まれる矩形を新たな文字
列矩形として抽出する文字列情報抽出部と、該文字列矩
形の抽出の結果を出力する結果出力部とを、具備するこ
とを特徴とする。
【0015】また、前記文字輪郭線検出部が、前記入力
画像の中で輝度値が急激に変化する画素をエッジ画素と
して検出しエッジ画像を得るエッジ検出部と、該エッジ
画像のスキャン方向を指定するスキャン方向制御部と、
該指定されたスキャン方向に該エッジ画像をスキャン
し、同一のライン上で隣接する2つのエッジ画素を選択
し、該2つのエッジ画素についてライン上の距離が予め
決めた値より小さいかどうか判断するエッジ間距離判断
部と、該距離が予め決めた値より小さいと判断された2
つのエッジ画素の勾配が反対であるかどうか判断するエ
ッジ勾配正負判断部と、該勾配正負が反対であると判断
された2つのエッジ画素間の輝度差が予め決めた範囲内
であるかどうか判断するエッジ間輝度差計算部と、該輝
度差が予め決めた範囲内であると判断された2つのエッ
ジ画素を一組のエッジペアとして検出するエッジペア検
出部と、該エッジペア画素を該指定された全てのスキャ
ン方向で求め、該求めた全エッジペア画素を文字輪郭線
とみなして文字輪郭線画像を作成する文字輪郭線画像作
成部とを、具備することを特徴とする。
【0016】また、前記文字列情報抽出部が、各ライン
毎にカウントした文字輪郭線画素の個数と文字領域の個
数の積を文字列特徴値として計算する文字列特徴値計算
部と、該文字列特徴値が予め設定した値以上の値を持つ
ラインを文字列ラインとして判断し、予め設定した値よ
り小さい値を持つラインを背景ラインとして判断する文
字列ライン判断部とを、具備することを特徴とする。
【0017】また、テロップ文字が表示されている映像
中の各入力画像に対し、前記の文字列情報抽出装置によ
り得た文字列矩形を入力し、該文字列矩形の水平方向の
長さと垂直方向の長さを比較し、水平方向の長さが長い
場合は該文字列矩形に囲まれるテロップ文字列は横書き
であると判断し、垂直方向の長さが長い場合は該文字列
矩形に囲まれるテロップ文字列は縦書きであると判断す
るテロップ文字列方向判断部と、該テロップ文字列が横
書きであると判断された場合は該文字列矩形の最も上側
のラインと最も下側のラインからテロップ文字列の高さ
を求め、該テロップ文字列が縦書きであると判断された
場合は該文字列矩形の最も左側のラインと最も右側のラ
インからテロップ文字列の幅を求めるテロップ文字列情
報抽出部と、該映像中の各入力画像から求めた複数の該
テロップ文字列の高さの値又は該テロップ文字列の幅の
値が近いテロップ文字列同士を一つのカテゴリとして分
類する複数テロップ文字列情報分類部と、該分類された
一つあるいは複数のカテゴリに対し予め決められた規則
を用いて意味付けを行うテロップ文字列意味付け部と、
該意味付けの結果を出力する結果出力部とを、具備する
ことを特徴とする。
【0018】なお、この構成において、テロップ文字列
方向判断部は、前記の文字列情報抽出装置を含む構成で
あっても良い。
【0019】同じく、前記の課題を解決するために、本
発明による文字列情報抽出方法は、入力画像に対して輝
度値が急激に変化する画素を文字の輪郭線上の画素とし
て検出し、文字輪郭線画像を得る文字輪郭線検出手順
と、該入力画像に対して画像内で局所的に輝度値が均一
であり連結する複数の画素を文字領域として抽出し、文
字領域画像を得る文字領域抽出手順と、該入力画像に対
して画像中の文字列を囲む矩形画像を抽出する文字列矩
形抽出手順と、該矩形画像の中で水平方向、垂直方向の
各ライン毎に走査し、該文字輪郭線画像から文字輪郭画
素の個数を、該文字領域画像から文字領域の個数を各ラ
イン毎にカウントし、該文字輪郭画素の個数及び該文字
領域の個数がともに高い値を取るラインを文字の画素を
含んだ文字列ラインとして抽出し、該矩形画像の水平ラ
イン中の最も上側の文字列ライン及び最も下側の文字列
ライン並びに垂直方向ライン中の最も左側の文字列ライ
ン及び最も右側の文字列ラインに囲まれる矩形を新たな
文字列矩形として抽出する文字列情報抽出手順と、該文
字列矩形の抽出の結果を出力する結果出力手順とを、有
することを特徴とする。
【0020】また、前記文字輪郭線検出手順では、前記
入力画像の中で輝度値が急激に変化する画素をエッジ画
素として検出するエッジ検出手順と、該エッジ画像のス
キャン方向を指定するスキャン方向制御手順と、該指定
されたスキャン方向に該エッジ画像をスキャンし、同一
のライン上で隣接する2つのエッジ画素を選択し、該2
つのエッジ画素についてライン上の距離が予め決めた値
より小さいかどうか判断するエッジ間距離判断手順と、
該距離が予め決めた値より小さいと判断された2つのエ
ッジ画素の勾配が反対であるかどうか判断するエッジ勾
配正負判断手順と、該勾配正負が反対であると判断され
た2つのエッジ画素間の輝度差が予め決めた範囲内であ
るかどうか判断するエッジ間輝度差計算手順と、該輝度
差が予め決めた範囲内であると判断された2つのエッジ
画素を一組のエッジペアとして検出するエッジペア検出
手順と、該エッジペア画素を該指定された全てのスキャ
ン方向で求め、該求めた全エッジペア画素を文字輪郭線
とみなして文字輪郭線画像を作成する文字輪郭線画像作
成手順とを、有することを特徴とする。
【0021】また、前記文字列情報抽出手順では、各ラ
イン毎にカウントした文字輪郭線画素の個数と文字領域
の個数の積を文字列特徴値として計算する文字列特徴値
計算手順と、該文字列特徴値が予め設定した値以上の値
を持つラインを文字列ラインとして判断し、予め設定し
た値より小さい値を持つラインを背景ラインとして判断
する文字列ライン判断手順とを、有することを特徴とす
る。
【0022】テロップ文字が表示されている映像中の各
入力画像に対し、前記の文字列情報抽出方法により得た
文字列矩形の水平方向の長さと垂直方向の長さを比較
し、水平方向の長さが長い場合は該文字列矩形に囲まれ
るテロップ文字列は横書きであると判断し、垂直方向の
長さが長い場合は該文字列矩形に囲まれるテロップ文字
列は縦書きであると判断するテロップ文字列方向判断手
順と、該テロップ文字列が横書きであると判断された場
合は該文字列矩形の最も上側のラインと最も下側のライ
ンからテロップ文字列の高さを求め、該テロップ文字列
が縦書きであると判断された場合は該文字列矩形の最も
左側のラインと最も右側のラインからテロップ文字列の
幅を求めるテロップ文字列情報抽出手順と、該映像中の
各入力画像から求めた複数の該テロップ文字列の高さの
値又は該テロップ文字列の幅の値が近いテロップ文字列
同士を一つのカテゴリとして分類する複数テロップ文字
列情報分類手順と、該分類された一つあるいは複数のカ
テゴリに対し予め決められた規則を用いて意味付けを行
うテロップ文字列意味付け手順と、該意味付けの結果を
出力する結果出力手順とを、有することを特徴とする。
【0023】また、前記の文字列情報抽出方法における
手順をコンピュータに実行させるプログラムとして該コ
ンピュータが読み取り可能な記録媒体に記録したことを
特徴とする。
【0024】本発明では、文字輪郭線情報と文字領域情
報を組み合わせることで、文字列の情報だけを選択的に
抽出し、文字列の高さや幅の情報を正確に抽出できるよ
うにしている。
【0025】すなわち、画像中の文字部、及び周囲部に
関して、一般にエッジ画素の数と文字領域抽出結果の領
域の個数には以下のような傾向がある。エッジ分布に関
しては、文字部のエッジ数は、文字周囲の背景部のエッ
ジ数よりも多い傾向がある。文字と背景間のコントラス
トが高く、背景部に高コントラスト部が少ない理想的な
場合には、文字部から得られるエッジ画素が背景部から
得られるそれに比べて圧倒的に多い。ただし、実際には
映像中のテロップ文字などにおいて、文字表示効果の影
響で文字境界のコントラストが低く、さらに文字周囲の
背景に高コントラスト部が多く存在することがあり、文
字部と背景部のエッジ数には際立った差が見られない場
合がある。領域分布に関しても、同じく文字の領域数
は、文字周囲の背景部のノイズ領域数よりも多い傾向に
ある。文字部の周囲の背景部に高コントラスト部やある
いは文字部の濃度に近い濃度を持つ部分が存在しなけれ
ば、文字領域のみが選択的に抽出され、周囲からノイズ
領域は抽出されない。ただし、映像中のテロップ文字に
付着する飾り効果等、文字周囲の背景部に文字と類似す
るようなコントラスト部を持ち、さらに、文字部の濃度
に近い部分が存在する場合は、文字周囲の背景からも領
域が多く抽出される。そこで、本発明では、各ラインの
エッジペア数と領域の数がともに高い値をとるラインを
文字列の存在するラインであると判断することで、文字
部のラインと背景部のラインの境界を従来方法よりも精
度よく求めることができ、より正確な文字列の高さ・幅
情報を得ることが可能となる。
【0026】また、画像中の文字部、及び周囲部に関し
て、一般にエッジ分布の特徴には、以下のような傾向が
ある。文字部からは、文字と背景の境界のコントラスト
が高いことから、文字輪郭部からエッジ画素が得られる
ことが多く、つまり隣接する2つのエッジ画素は、その
距離がほぼ線幅値に近く、また、濃度勾配の正負が反対
であり、さらには、エッジの内側画素は文字内部のため
濃度値がほぼ等しい、という特徴がある。これに対し、
背景部の濃度分布は任意であるため、必ずしも、文字部
と同等な特徴は持たない。そこで、本発明において定義
したエッジペア画素を検出することで、文字部からのエ
ッジ画素を従来方法よりも精度よく選択的に検出するこ
とが可能となる。
【0027】また、通常、ニュース映像などの放送映像
では、最初に見出しを表すテロップ文字が画面上で大き
く表示され、見出し以外のニュース内容の詳細を説明す
るテロップは見出しのテロップよりも小さく表示される
等、重要な文字を大きく表示する傾向がある。そこで本
発明では、映像中の複数のテロップ文字列の方向を判断
し、それを基に文字列の高さと幅の情報を分類し、高さ
や幅の値が大きいテロップが表示されている画面を映像
中のテロップ画面の中でも重要度の高い画面として意味
付けることで、映像の構造化を行う上で有益な情報とし
て利用することが可能となる。
【0028】
【発明の実施の形態】以下、本発明について図面を参照
して実施の形態ととも詳細に説明する。
【0029】図1は、本発明による文字列情報抽出装
置、及び方法の構成の一実施形態例を示すブロック図で
ある。
【0030】図1において、1は、画像データを、例え
ばコンピュータに入力し、メモリに記憶する画像入力記
憶部である。
【0031】2は、画像入力記憶部1で入力、記憶され
た画像データに対し、輝度値が急激に変化する画素を文
字輪郭線画素として検出し、文字輪郭線画像を作成する
文字輪郭線検出部である。
【0032】3は、画像入力記憶部1で入力、記憶され
た画像データに対し、画像内で局所的に輝度値が均一で
あり、連結する複数の画素を文字領域として抽出し、文
字領域画像を得る文字領域抽出部である。
【0033】4は、画像入力記憶部1で入力、記憶され
た画像データに対し、予め決められた文字列矩形抽出法
を用いるか、あるいは、予め画像内の文字列を囲む範囲
を指定することにより、画像中の文字列を囲む矩形画像
を得る文字列矩形抽出部である。
【0034】5は、該文字列矩形抽出部4により得られ
た画像中の文字列を含む矩形画像の中で水平方向、垂直
方向の各ライン毎に走査し、該文字輪郭線検出部から得
られた文字輪郭画素の個数と該文字領域抽出部から得ら
れた文字領域の個数を求め、各ライン毎に文字輪郭画素
の個数、及び文字領域の個数がともに高い値をとる場
合、該ラインを文字の画素を含んだ文字列ラインとして
抽出し、該矩形画像の水平ライン中の最も上側の文字列
ライン、及び最も下側の文字列ライン、垂直方向ライン
中の最も左側の文字列ライン、及び最も右側の文字列ラ
インに囲まれる矩形を新たな文字列矩形として抽出する
文字列情報抽出部である。
【0035】6は、文字列情報抽出部5の結果を出力す
る結果出力部である。
【0036】7は、前記画像入力記憶部1、文字輪郭線
検出部2、文字領域抽出部3、文字列矩形抽出部4文字
列情報抽出部5、結果出力部6の処理を実行するための
制御を行う処理制御部である。
【0037】図1の構成において、本発明の一実施形態
例を説明する。
【0038】まず、テレビやビデオ、あるいはカメラ等
の画像情報を画像入力記憶部1によりコンピュータ上の
メモリに記憶する。
【0039】記憶された画像データに対し、文字輪郭線
検出部2において、画像中の輝度が急激に変化する画素
を検出するための従来提案されているエッジ検出方法、
例えば、Sobelオペレータを用いる方法やRobi
nsonオペレータを用いる方法を用いて、エッジ画素
を検出し、これを文字輪郭線画素とみなし文字輪郭線画
像を作成する。
【0040】また、文字領域抽出部3では、画像入力記
憶部1で記憶された画像データに対し、予め決められた
文字領域抽出法(例えば、文献[4]「桑野、新井、倉
掛、杉村、“ライン単位の二値化による映像中文字領域
の抽出方法”、信学秋大、D−12−42,1998」
で提案されている方法)を用いて、文字領域画像を作成
する。
【0041】また、文字列矩形抽出部4では、画像入力
記憶部1で記憶された画像データに対し、先に示した文
献[1]〜[3]等で提案されている方法を用いるか、
予め手入力等により矩形の範囲を設定することで、文字
列を囲む矩形画像を抽出する。
【0042】文字列情報抽出部5では、文字列矩形抽出
部4で抽出された文字列矩形画像内で文字輪郭線検出部
2で求めた文字輪郭画素の個数と文字領域抽出部3で求
めた文字領域の個数を水平、垂直の各ライン毎に数え、
文字輪郭画素の個数、及び文字領域の個数がともに高い
値をとる場合、該ラインを文字の画素を含んだ文字列ラ
インとして抽出し、該矩形画像の水平ライン中の最も上
側の文字列ライン、及び最も下側の文字列ライン、垂直
方向ライン中の最も左側の文字列ライン、及び最も右側
の文字列ラインに囲まれる矩形を新たな文字列矩形とし
て抽出する。
【0043】結果出力部6では、文字列情報抽出部5の
結果をコンピュータの上のメモリやディスク上のファイ
ル、あるいは、ディスプレイ上に表示などして出力す
る。
【0044】処理制御部7では、一連の処理を行う上で
の同期とりを行う。
【0045】図2は、図1の文字輪郭線検出部2を実施
する装置の構成の一実施形態例を示すブロック図であ
る。
【0046】図2において、21は図1の画像入力記憶
部1で入力された画像に対し、予め決められた方法でエ
ッジ検出処理を行うエッジ検出部である。
【0047】22は、エッジ検出処理を施した各フレー
ム画像に対して、エッジヘアカウント処理を行うスキャ
ン方向を制御するスキャン制御部である。
【0048】23は、スキャン制御部22により指定さ
れたスキャン方向に前記エッジ画像をスキャンし、同一
のスキャンライン上で隣接する2つのエッジ画素を選択
し、選択した2つのエッジ画素について、ライン上の距
離が予め決められた値より小さいかどうか判断するエッ
ジ間距離判断部である。
【0049】24は、エッジ間距離判断部23により同
一のスキャンライン上で距離が予め決められた値より小
さいと判断された隣接する2つのエッジの勾配が反対で
あるかどうか判断するエッジ勾配判断部である。
【0050】25は、エッジ勾配判断部24により、同
一ライン上で距離が予め決められた値よりも小さく、且
つ勾配正負が反対であると判断された隣接する2つのエ
ッジの内側画素の輝度差が予め設定された範囲内にある
かどうか判断するエッジ間輝度差判断部である。
【0051】26は、エッジ間輝度差判断部25によ
り、同一ライン上で距離が予め決められた値よりも小さ
く、且つ勾配正負が反対であり、且つ内側画素の輝度差
が予め設定された範囲内にある隣接する2つのエッジ点
を一組のエッジペアと定義し、カウントするエッジペア
検出部である。
【0052】27は、エッジペア検出部26により得ら
れたエッジペアをスキャン制御部22により指定された
全てのスキャン方向で求め、文字輪郭線画像を作成する
文字輪郭線画像作成部である。
【0053】図3は、図1、及び図2の文字輪郭線検出
部2の処理の実施形態例を説明するためのフローチャー
トである。
【0054】前記エッジ検出部21において、ステップ
(31)で、前記画像入力記憶部1で入力された画像を
コンピュータ上のメモリに読み、この画像に対し、ステ
ップ(32)で、予め決められたエッジ検出方法を用い
てエッジの勾配の方向情報も伴ったエッジ検出処理を行
う。検出されたエッジ画素情報はスキャン制御部22に
渡される。
【0055】勾配方向情報を伴ったエッジ検出には、例
えばSobelのエッジ検出オペレータやRobins
onのエッジ検出オペレータ等の従来提案されている方
法を用いればよい。
【0056】次に、スキャン制御部22において、ステ
ップ(33)で、エッジ検出部21で検出されたエッジ
画素に対し、エッジペア検出処理が未処理のスキャン方
向が存在するかどうかを判断し、未処理のスキャン方向
が存在すれば処理対象スキャン方向を指定し、ステップ
(34)へ移り、未処理のスキャン方向が存在しない場
合はステップ(39)へ移る、ステップ(34)では、
処理対象スキャン方向に画像をスキャンしながら、エッ
ジペア検出処理が未処理のエッジ画素があるかどうかを
判断し、未処理のエッジ画素が存在すればステップ(3
5)へ移り、未処理のエッジ点が存在しない場合はステ
ップ(33)へ移る。
【0057】図4は、ステップ(33)の一例を説明す
る図であり、図4ではスキャン方向を水平方向、垂直方
向の2方向に設定した例であり、矢印の方向がスキャン
方向を示す。
【0058】次に、エッジ間距離判断部23において、
ステップ(35)で、スキャン方向に存在する同一ライ
ン上で隣接する2つのエッジ画素の距離が予め設定した
値より小さいかどうか判断し、小さい場合はステップ
(36)へ移り、小さくない場合はステップ(34)へ
移る。
【0059】次に、エッジ勾配判断部24において、ス
テップ(36)で、エッジ間距離判断部23でスキャン
方向に存在する距離が予め決めた値よりも小さい隣接す
る2つのエッジ画素の勾配がスキャン方向に対し「登
り」か「下り」かを判断し、同じであればステップ(3
4)へ移り、反対方向であればステップ(37)へ移
る。
【0060】図5は、ステップ(36)の一例を説明す
る図であり、入力文字画像、及び入力文字画像上の水平
方向のあるスキャンライン上の座標値を横軸、その座標
における画像濃度レベルを縦軸にとったグラフを示す。
エッジの勾配方向に関して、「登り」は低濃度から高濃
度への変化を意味し、「下り」は高濃度から低濃度への
変化を意味する。スキャンライン上の隣接する2つのエ
ッジの勾配が、「登り」「登り」、あるいは「下り」
「下り」という同じ方向を持つ関係である場合はエッジ
ペアをカウントせず、「登り」「下り」、あるいは「下
り」「登り」の場合、エッジペアを1だけインクリメン
トすると図5に示されたスキャンライン上のエッジペア
数は13である。
【0061】次に、エッジ間輝度差計算部25におい
て、ステップ(37)で、エッジ勾配判断部24で同一
ライン上で距離が予め決めた値より小さく、勾配が反対
である2つの隣接エッジ画素の輝度差が予め設定した範
囲内かどうか判断し、範囲内であればステップ(38)
へ移り、範囲に入っていなければステップ(34)へ移
る。
【0062】図6は、ステップ(37)の一例を説明す
る図であり、あるスキャンライン上の座標値を横軸、そ
の座標における画像濃度レベルを縦軸にとったグラフで
ある。図中では1組のエッジペア画素A,Bの付近の輝
度分布を示しており、エッジペア画素間の輝度レベルの
差を矢印の範囲で示しており、ステップ(37)ではこ
の差が予め設定した範囲に入るかどうかを判断する。
【0063】次に、エッジペア検出部26において、ス
テップ(38)で、スキャン方向で隣接する2つのエッ
ジの距離が予め指定した値より小さく、勾配が互いに反
対であり、且つ、エッジ間の輝度変化が予め設定した範
囲内の場合、エッジペア数を1だけインクリメントす
る。
【0064】次に、文字輪郭線画像作成部27におい
て、ステップ(39)で、スキャン方向毎に求められた
エッジペア画素からなる文字輪郭線画像を作成する。
【0065】図7は、ステップ(39)を補足する図で
あり、画像全体でのエッジペアの数え方を説明する図で
ある。水平方向の全スキャンライン上のエッジペアの合
計は11、垂直方向の全スキャンライン上のエッジペア
の合計は9であり、スキャン方向毎に求めたエッジペア
の総数は、水平方向+垂直方向=11+9である。
【0066】図8は、図1の文字列情報抽出部5を実施
する装置の構成の一実施形態例を示すブロック図であ
る。
【0067】図8において、51は、前記文字列矩形抽
出部4により得られた文字列矩形画像を水平、及び垂直
方向の各ライン毎にカウントした文字輪郭線画素の個数
と文字領域の個数の積を各ラインの文字列特徴値として
計算する文字列特徴値計算部である。
【0068】52は、該文字列特徴値計算部51で得ら
れた文字列特徴値が予め設定した値以上の値を持つライ
ンを文字列ラインとして判断し、予め設定した値より小
さい値を持つラインを背景ラインとして判断する文字列
ライン判断部である。
【0069】図9は、図1、図8の文字列情報抽出部5
の一実施形態例を説明するためのフローチャートであ
る。
【0070】まず、ステップ(91)で、図1の文字輪
郭線検出部2で得られた文字輪郭線画像を読み込む。
【0071】図10は、ステップ(91)を補足する図
であり、(a)は入力画像、(b)は従来のSobel
オペレータを用いたエッジ検出方法により得た文字輪郭
線画像、(c)は、本発明による文字輪郭線画像の一例
である。文字部分から選択的にエッジペア画素が得られ
ていることが確認できる。この例の場合、ステップ(9
1)では、(c)の画像を読み込む。
【0072】ステップ(92)では、図1の文字領域抽
出部3で得られた文字領域画像を読み込む。
【0073】図11は、ステップ(92)を補足する図
であり、文字領域画像の一例を示す。文献[4]の従来
の文字領域抽出法を用いて得た文字領域画像である。
【0074】ステップ(93)では、図1の文字列候補
矩形抽出部4で得られた文字列候補矩形画像を読み込
む。
【0075】図12は、ステップ(93)を補足する図
であり、図11の文字列領域画像中に文献[3]の従来
の文字列候補矩形抽出法を用いて得た横書きの文字列の
矩形を示したものである。矩形内に文字列は全て含まれ
るが、文字列の正確な高さの値を出すためには情報が不
足である。図12は説明の便宜上、文字列矩形は一つだ
け選択して示した。
【0076】ステップ(94)では、ステップ(93)
で読み込んだ一つ、あるいは複数の文字列矩形のうち、
文字列情報抽出処理が未処理の画像があるかどうか判断
し、未処理の画像があればステップ(95)に移り、未
処理の画像がなければステップ(99)に移る。文字列
矩形が図12に示したものの場合、以後の処理対象にな
る文字列矩形は一つになる。
【0077】ステップ(95)では、文字列情報抽出の
処理対象である文字列候補矩形中で、文字列特徴量を計
算する処理が未処理のラインがあるかどうか判断し、未
処理のラインが存在する場合、ステップ(96)に移
り、未処理のラインが存在しない場合、ステップ(6
4)に移る。
【0078】ステップ(96)では、文字列情報抽出処
理対象の文字列候補矩形の中の文字列特徴量を計算する
処理対象のライン上に含まれるステップ(92)で読み
込まれた文字領域画像中の文字領域の個数を数える。
【0079】図12は、ステップ(96)を補足する図
でもあり、ステップ(92)で読み込まれた文字領域画
像中で、ステップ(93)で読み込まれた横書きの卒字
列候補矩形の範囲を示す。この場合、矩形中の注目水平
ライン上の文字領域の個数は16である。
【0080】ステップ(97)では、文字列情報抽出処
理対象の文字列候補矩形の中の文字列特徴量を計算する
処理対象のライン上に含まれるステップ(91)で読み
込まれたエッジペア画像中のエッジペア画素の個数を数
える。
【0081】図13は、ステップ(97)を補足する図
であり、ステップ(91)で読み込まれた文字輪郭線画
像中で、ステップ(93)で読み込まれた横書きの文字
列候補矩形の範囲を示す。矩形中の注目水平ライン上の
文字輪郭線画素の個数は30個である。
【0082】ステップ(98)では、文字列情報抽出処
理対象の文字列候補矩形の中の文字列特徴量を計算する
処理対象のライン上で、ステップ(96)及びステップ
(97)で求めた文字領域の個数と文字輪郭線画素の個
数を掛け合わせた値を文字列特徴値として計算する。
【0083】ステップ(99)は、水平、及び垂直の各
方向のライン毎に求めた文字列特徴値が予め設定した閾
値以上の場合、該ラインを文字列ラインと判断し、閾値
より小さい場合、該ラインを背景部のラインと判断す
る。
【0084】ただし、文字列特徴値は、必ずしもステッ
プ(98)のようにライン上の文字輪郭線画素の個数と
文字領域の個数の積で定義しなくともよい。文字輪郭線
画素の個数と文字領域の個数をともに利用し、文字列に
載るラインと載らないラインを判別できれば他の定義で
もよい。例えば、ライン上の文字輪郭線画素の個数と文
字領域の個数のそれぞれの合計を独立に予め設定した閾
値と比較し、両者ともに閾値以上の場合、該ラインを文
字列ラインと判断してもよい。あるいは、ライン上の文
字輪郭線画素の個数と文字領域の個数のそれぞれの合計
に予め設定した重みを掛けあわせて、両者の和をとり、
この値が予め設定した閾値以上の場合、該ラインを文字
列ラインと判断するなどしてもよい。
【0085】図14は、図9中のステップ(99)、及
びステップ(99)の処理内容を補足するためのもので
あり、文献[3]の従来の文字列矩形抽出法で抽出した
文字列矩形をやや細い実線で囲み、本発明により抽出し
た文字列矩形をやや太い実線で囲んだ画像を示す。ま
た、画像の横に文献[3]の従来の方法による文字列矩
形の水平ライン毎の文字列特徴値の分布の模式図を示
す。従来の方法よりも正確に文字列の矩形が抽出できて
いることが確認できる。これは、図12、図13より、
矩形内の文字部に関しては、実際の画像中の文字表示部
に相当する部分から文字輪郭線画素、及び文字領域とも
に抽出できているが、矩形内の背景部に関しては文字輪
郭線画素と文字領域が必ずしもともに存在せず、文字列
特徴値の一例として文字輪郭画素と文字領域の個数の積
をとると、文字部のラインからは高い値が得られ、背景
部のラインからは文字部よりも極めて低い値が得られ、
両者を分離しやすい、文字列特徴値の分布が得られるた
めである。
【0086】図15は、本発明による上記の実施形態例
の文字列情報抽出装置を映像中のテロップ文字が表示さ
れている画像に対して適用し、文字列情報を抽出する装
置の一実施形態例を説明するための図である。
【0087】図15において、151は、映像中のテロ
ップ文字が表示されている画像を入力するテロップ表示
画像入力記憶部である。
【0088】152は、前記テロップ表示画像入力記憶
部151により入力された画像に対し、前述の文字列情
報抽出装置により得た文字列矩形を入力し、その文字列
矩形の水平方向の長さと垂直方向の長さを比較し、水平
方向の長さが長い場合は、該文字列矩形に囲まれる文字
列は横書きであると判断し、垂直方向の長さが長い場合
は、該文字列矩形に囲まれる文字列は縦書きであると判
断するテロップ文字列方向判断部である。
【0089】なお、前述の文字列情報抽出装置と本文字
列情報抽出装置とは別体に構成しても良いし、本文字列
情報抽出装置のテロップ文字列方向判断部内に内蔵させ
ても構わない。
【0090】153は、該文字列方向判断部152で得
られた文字列方向が横書きの場合、該文字列矩形の最も
上側のラインと最も下側のラインから文字列の高さを求
め、テロップ文字列が縦書きの場合、該文字列矩形の最
も左側のラインと最も右側のラインから文字列の幅を求
めるテロップ文字列情報抽出部である。
【0091】154は、該テロップ文字列情報抽出部1
53により抽出したある映像中に表示される複数のテロ
ップ文字の高さ、及び幅の値を予め決められた分類方法
を用いて、高さ、幅に関して近い値を持つテロップ文字
列同士を一つのカテゴリとして抽出する複数テロップ文
字列情報分類部である。
【0092】155は、該複数テロップ文字列情報分類
部154により分類され、一つあるいは複数のテロップ
文字列カテゴリに対し、予め決められた規則を用いて、
意味付けを行うテロップ文字列意味付け部である。
【0093】156は、該テロップ文字列意味付け部の
結果を出力する結果出力部である。
【0094】157は、前記テロップ表示画像入力記憶
部151、テロップ文字列方向判断部152、テロップ
文字列情報抽出部153、複数テロップ文字列情報分類
部154、テロップ文字列意味付け部155、結果出力
部156の処理実効を制御する処理制御部である。
【0095】図16は、本発明の文字列情報抽出装置を
ニュース映像中のテロップ文字表示画像に対して適用し
た例を示す模式図である。
【0096】図16の(a)は、ニュース映像中の全て
のテロップ文字が表示されている画像を示す。見出しの
テロップは大きく、それ以外のテロップは小さい。図1
6の(b)は、(a)の全画像から本発明の文字列情報
抽出装置を用いて抽出したテロップ文字の高さ、幅の情
報に関して、横軸を高さ、幅の値、縦軸をテロップ文字
列の個数とするヒストグラムで表した模式図である。図
16の(c)は、(b)のヒストグラムを予め決めた方
法(例えば、判別分析法)を用いて、大小の二つのカテ
ゴリに分割した例を示す模式図である。図16の(d)
は、(c)のカテゴライズの結果により、大きい文字列
カテゴリに含まれるテロップ文字が表示される画面だけ
を取り出し、ニュース映像の見出しだけを表示した例で
ある。これにより大量のニュース映像を、見出し画面だ
けを参照するだけで短時間で把握することが可能とな
る。
【0097】なお、図1、図2、図8、図15を用いて
示した装置各部の一部もしくは全部の機能を、コンピュ
ータを用いて実現することができること、あるいは、そ
れらの図面とともに図3、図9を用いて示した処理手順
をコンピュータに実行させることができることは言うま
でもなく、コンピュータでその各部の機能を実現するた
めのプログラム、あるいは、コンピュータにその処理手
順を実行させるためのプログラムを、そのコンピュータ
が読み取り可能な記憶媒体、例えば、FD(フロッピー
ディスク)や、MO、ROM、メモリカード、CD、D
VD、リムーバブルディスクなどに記録し、提供し、配
布することが可能である。
【0098】
【発明の効果】以上の説明の通り、本発明によれば、文
字を含む画像に対して、文字輪郭線検出処理、文字領域
抽出処理、文字列候補矩形抽出処理を行い、文字列候補
矩形の中で、文字輪郭線情報と文字領域情報を組み合わ
せて各ライン毎に文字列特徴値を計算し、閾値処理する
ことで、従来よりも正確に文字列の高さ、あるいは幅の
値を求めることが可能となる。
【0099】さらには、映像中のテロップ文字が表示さ
れる画像、複数枚に対して本発明を適用し、抽出された
文字列の高さ情報を分類し、分類された各カテゴリ毎に
あらかじめ決めた規則で意味付けを行うことが可能とな
り、映像の構造化を行う上で有効な情報となる。例え
ば、ニュース映像中のテロップ文字画像に本発明を適用
して、文字列の正確な高さ情報を抽出し、映像中の全て
のテロップ文字画像中の文字列高さ情報を大小二つのカ
テゴリに分類し、大きいほうのカテゴリ中のテロップ文
字画面を抽出することでニュース項目の見出しテロップ
だけを選択的に参照することが可能となる。
【図面の簡単な説明】
【図1】本発明を実施する装置の構成の一実施形態例を
示すブロック図である。
【図2】図1中の文字輪郭線検出部を実施する装置の構
成の一実施形態例を示すブロック図である。
【図3】図1中、及び図2に示した文字輪郭線検出部の
処理の一実施形態例を説明するためのフローチャートで
ある。
【図4】(a),(b)は、図3中のステップ(33)
の処理内容を補足説明するためのものであり、スキャン
方向の例を示す図である。
【図5】図3中のステップ(36)の処理内容を補足説
明するためのものであり、エッジ勾配の判断、及びエッ
ジペアのカウントの例を示す図である。
【図6】図3中のステップ(37)の処理内容を補足説
明するためのものであり、エッジ間の輝度差の算出対象
箇所を示す図である。
【図7】(a),(b)は、図3中のステップ(39)
の処理内容を補足説明するためのものであり、画像全体
でのエッジペアの数え方の例を示す図である。
【図8】図1中の文字列情報抽出部を実施する装置の構
成の一実施形態例を示すブロック図である。
【図9】図1中、及び図8に示した文字列情報抽出部の
処理の一実施形態例を説明するためのフローチャートで
ある。
【図10】(a),(b),(c)は、図9中のステッ
プ(91)の処理内容を補足説明するためのものであ
り、入力画像、従来手法による文字輪郭線画像、本発明
による文字輪郭線検出画像の一例を示す図である。
【図11】図9中のステップ(92)の処理内容を補足
説明するためのものであり、文字領域画像の一例を示す
図である。
【図12】図9中のステップ(96)の処理内容を補足
説明するためのものであり、文字領域画像中の文字列候
補矩形範囲の一例、及び注目ライン上の文字領域の個数
を示す図である。
【図13】図9中のステップ(97)の処理内容を補足
するためのものであり、文字輪郭線画像中の文字列候補
矩形範囲の一例、及び注目ライン上の文字輪郭線画素の
個数を示す図である。
【図14】図10の入力画像に対し得られた文献[3]
の従来方法による文字列矩形と本発明により得られた文
字列矩形を図11の文字領域画像上に示し、画像の横
に、文献[3]の従来方法により得られた矩形の範囲内
の各水平ライン毎の文字列特徴値の分布を示した図であ
る。
【図15】映像中のテロップ文字画像の文字列情報を抽
出してテロップ文字画像に意味付けを行う装置の構成の
一例を示すブロック図である。
【図16】(a),(b),(c),(d)は、本発明
の文字列情報抽出装置をニュース映像中のテロップ文字
表示画像に対して適用した例を示す模式図である。
【符号の説明】
1…画像入力記憶部 2…文字輪郭線検出部 21…エッジ検出部 22…スキャン制御部 23…エッジ間距離判断部 24…エッジ勾配判断部 25…エッジ間輝度差判断部 26…エッジペア検出部 27…文字輪郭線画像作成部 3…文字領域抽出部 4…文字列矩形抽出部 5…文字列情報抽出部 51…文字列特徴値計算部 52…文字列ライン判断部 6…結果出力部 7…処理制御部 151…テロップ表示画像入力記憶部 152…テロップ文字列方向判断部 153…テロップ文字列情報抽出部 154…複数テロップ文字列情報分類部 155…テロップ文字列意味付け部 156…結果出力部 157…処理制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 児島 治彦 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B029 CC28 CC29

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力画像に対して輝度値が急激に変化す
    る画素を文字の輪郭線上の画素として検出し、文字輪郭
    線画像を得る文字輪郭線検出部と、 該入力画像に対して画像内で局所的に輝度値が均一であ
    り連結する複数の画素を文字領域として抽出し文字領域
    画像を得る文字領域抽出部と、 該入力画像に対して画像中の文字列を囲む矩形画像を抽
    出する文字矩形抽出部と、 該矩形画像の中で水平方向、垂直方向の各ライン毎に走
    査し、該文字輪郭線画像から文字輪郭画素の個数を、該
    文字領域画像から文字領域の個数を各ライン毎にカウン
    トし、該文字輪郭画素の個数及び該文字領域の個数がと
    もに高い値を取るラインを文字の画素を含んだ文字列ラ
    インとして抽出し、該矩形画像の水平ライン中の最も上
    側の文字列ライン及び最も下側の文字列ライン並びに垂
    直方向ライン中の最も左側の文字列ライン及び最も右側
    の文字列ラインに囲まれる矩形を新たな文字列矩形とし
    て抽出する文字列情報抽出部と、 該文字列矩形の抽出の結果を出力する結果出力部とを、 具備することを特徴とする文字列情報抽出装置。
  2. 【請求項2】 前記文字輪郭線検出部が、 前記入力画像の中で輝度値が急激に変化する画素をエッ
    ジ画素として検出しエッジ画像を得るエッジ検出部と、 該エッジ画像のスキャン方向を指定するスキャン方向制
    御部と、 該指定されたスキャン方向に該エッジ画像をスキャン
    し、同一のライン上で隣接する2つのエッジ画素を選択
    し、該2つのエッジ画素についてライン上の距離が予め
    決めた値より小さいかどうか判断するエッジ間距離判断
    部と、 該距離が予め決めた値より小さいと判断された2つのエ
    ッジ画素の勾配が反対であるかどうか判断するエッジ勾
    配正負判断部と、 該勾配正負が反対であると判断された2つのエッジ画素
    間の輝度差が予め決めた範囲内であるかどうか判断する
    エッジ間輝度差計算部と、 該輝度差が予め決めた範囲内であると判断された2つの
    エッジ画素を一組のエッジペアとして検出するエッジペ
    ア検出部と、 該エッジペア画素を該指定された全てのスキャン方向で
    求め、該求めた全エッジペア画素を文字輪郭線とみなし
    て文字輪郭線画像を作成する文字輪郭線画像作成部と
    を、 具備することを特徴とする請求項1記載の文字列情報抽
    出装置。
  3. 【請求項3】 前記文字列情報抽出部が、 各ライン毎にカウントした文字輪郭線画素の個数と文字
    領域の個数の積を文字列特徴値として計算する文字列特
    徴値計算部と、 該文字列特徴値が予め設定した値以上の値を持つライン
    を文字列ラインとして判断し、予め設定した値より小さ
    い値を持つラインを背景ラインとして判断する文字列ラ
    イン判断部とを、 具備することを特徴とする請求項1又は2記載の文字列
    情報抽出装置。
  4. 【請求項4】 テロップ文字が表示されている映像中の
    各入力画像に対し、請求項1,2,3のいずれか1項記
    載の文字列情報抽出装置により得た文字列矩形を入力
    し、該文字列矩形の水平方向の長さと垂直方向の長さを
    比較し、水平方向の長さが長い場合は該文字列矩形に囲
    まれるテロップ文字列は横書きであると判断し、垂直方
    向の長さが長い場合は該文字列矩形に囲まれるテロップ
    文字列は縦書きであると判断するテロップ文字列方向判
    断部と、 該テロップ文字列が横書きであると判断された場合は該
    文字列矩形の最も上側のラインと最も下側のラインから
    テロップ文字列の高さを求め、該テロップ文字列が縦書
    きであると判断された場合は該文字列矩形の最も左側の
    ラインと最も右側のラインからテロップ文字列の幅を求
    めるテロップ文字列情報抽出部と、 該映像中の各入力画像から求めた複数の該テロップ文字
    列の高さの値又は該テロップ文字列の幅の値が近いテロ
    ップ文字列同士を一つのカテゴリとして分類する複数テ
    ロップ文字列情報分類部と、 該分類された一つあるいは複数のカテゴリに対し予め決
    められた規則を用いて意味付けを行うテロップ文字列意
    味付け部と、 該意味付けの結果を出力する結果出力部とを、 具備することを特徴とする文字列情報抽出装置。
  5. 【請求項5】 前記テロップ文字列方向判断部が、 請求項1,2,3のいずれか1項記載の文字列情報抽出
    装置を具備することを特徴とする請求項4記載の文字列
    情報抽出装置。
  6. 【請求項6】 入力画像に対して輝度値が急激に変化す
    る画素を文字の輪郭線上の画素として検出し、文字輪郭
    線画像を得る文字輪郭線検出手順と、 該入力画像に対して画像内で局所的に輝度値が均一であ
    り連結する複数の画素を文字領域として抽出し、文字領
    域画像を得る文字領域抽出手順と、 該入力画像に対して画像中の文字列を囲む矩形画像を抽
    出する文字列矩形抽出手順と、 該矩形画像の中で水平方向、垂直方向の各ライン毎に走
    査し、該文字輪郭線画像から文字輪郭画素の個数を、該
    文字領域画像から文字領域の個数を各ライン毎にカウン
    トし、該文字輪郭画素の個数及び該文字領域の個数がと
    もに高い値を取るラインを文字の画素を含んだ文字列ラ
    インとして抽出し、該矩形画像の水平ライン中の最も上
    側の文字列ライン及び最も下側の文字列ライン並びに垂
    直方向ライン中の最も左側の文字列ライン及び最も右側
    の文字列ラインに囲まれる矩形を新たな文字列矩形とし
    て抽出する文字列情報抽出手順と、 該文字列矩形の抽出の結果を出力する結果出力手順と
    を、 有することを特徴とする文字列情報抽出方法。
  7. 【請求項7】 前記文字輪郭線検出手順では、 前記入力画像の中で輝度値が急激に変化する画素をエッ
    ジ画素として検出するエッジ検出手順と、 該エッジ画像のスキャン方向を指定するスキャン方向制
    御手順と、 該指定されたスキャン方向に該エッジ画像をスキャン
    し、同一のライン上で隣接する2つのエッジ画素を選択
    し、該2つのエッジ画素についてライン上の距離が予め
    決めた値より小さいかどうか判断するエッジ間距離判断
    手順と、 該距離が予め決めた値より小さいと判断された2つのエ
    ッジ画素の勾配が反対であるかどうか判断するエッジ勾
    配正負判断手順と、 該勾配正負が反対であると判断された2つのエッジ画素
    間の輝度差が予め決めた範囲内であるかどうか判断する
    エッジ間輝度差計算手順と、 該輝度差が予め決めた範囲内であると判断された2つの
    エッジ画素を一組のエッジペアとして検出するエッジペ
    ア検出手順と、 該エッジペア画素を該指定された全てのスキャン方向で
    求め、該求めた全エッジペア画素を文字輪郭線とみなし
    て文字輪郭線画像を作成する文字輪郭線画像作成手順と
    を、 有することを特徴とする請求項6記載の文字列情報抽出
    方法。
  8. 【請求項8】 前記文字列情報抽出手順では、 各ライン毎にカウントした文字輪郭線画素の個数と文字
    領域の個数の積を文字列特徴値として計算する文字列特
    徴値計算手順と、 該文字列特徴値が予め設定した値以上の値を持つライン
    を文字列ラインとして判断し、予め設定した値より小さ
    い値を持つラインを背景ラインとして判断する文字列ラ
    イン判断手順とを、 有することを特徴とする請求項6又は7記載の文字列情
    報抽出方法。
  9. 【請求項9】 テロップ文字が表示されている映像中の
    各入力画像に対し、請求項6,7,8のいずれか1項記
    載の文字列情報抽出方法により得た文字列矩形の水平方
    向の長さと垂直方向の長さを比較し、水平方向の長さが
    長い場合は該文字列矩形に囲まれるテロップ文字列は横
    書きであると判断し、垂直方向の長さが長い場合は該文
    字列矩形に囲まれるテロップ文字列は縦書きであると判
    断するテロップ文字列方向判断手順と、 該テロップ文字列が横書きであると判断された場合は該
    文字列矩形の最も上側のラインと最も下側のラインから
    テロップ文字列の高さを求め、該テロップ文字列が縦書
    きであると判断された場合は該文字列矩形の最も左側の
    ラインと最も右側のラインからテロップ文字列の幅を求
    めるテロップ文字列情報抽出手順と、 該映像中の各入力画像から求めた複数の該テロップ文字
    列の高さの値又は該テロップ文字列の幅の値が近いテロ
    ップ文字列同士を一つのカテゴリとして分類する複数テ
    ロップ文字列情報分類手順と、 該分類された一つあるいは複数のカテゴリに対し予め決
    められた規則を用いて意味付けを行うテロップ文字列意
    味付け手順と、 該意味付けの結果を出力する結果出力手順とを、 有することを特徴とする文字列情報抽出方法。
  10. 【請求項10】 請求項6,7,8,9のいずれか1項
    記載の文字列情報抽出方法における手順を、コンピュー
    タに実行させるプログラムとして該コンピュータが読み
    取り可能な記録媒体に記録したことを特徴とする文字列
    情報抽出方法を記録した記録媒体。
JP25394499A 1999-09-08 1999-09-08 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 Expired - Lifetime JP3544324B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25394499A JP3544324B2 (ja) 1999-09-08 1999-09-08 文字列情報抽出装置及び方法及びその方法を記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25394499A JP3544324B2 (ja) 1999-09-08 1999-09-08 文字列情報抽出装置及び方法及びその方法を記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001076094A true JP2001076094A (ja) 2001-03-23
JP3544324B2 JP3544324B2 (ja) 2004-07-21

Family

ID=17258172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25394499A Expired - Lifetime JP3544324B2 (ja) 1999-09-08 1999-09-08 文字列情報抽出装置及び方法及びその方法を記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3544324B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164253A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
JP2008154200A (ja) * 2006-12-14 2008-07-03 Samsung Electronics Co Ltd 動画像の字幕検出装置およびその方法
JP2008305099A (ja) * 2007-06-06 2008-12-18 Sharp Corp 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体
US7519264B2 (en) 2003-05-15 2009-04-14 Pioneer Corporation Broadcast program contents menu creation apparatus and method
JP2009289075A (ja) * 2008-05-29 2009-12-10 Nippon Telegr & Teleph Corp <Ntt> 図形領域抽出装置、図形領域抽出方法、プログラム、及び記録媒体
JP2014147069A (ja) * 2013-01-29 2014-08-14 Sharp Corp 方向判定装置、方向判定方法、及びコンピュータ読み取り可能な記録媒体
CN111062317A (zh) * 2019-12-16 2020-04-24 中国计量大学上虞高等研究院有限公司 一种扫描文档的裁边方法与系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519264B2 (en) 2003-05-15 2009-04-14 Pioneer Corporation Broadcast program contents menu creation apparatus and method
JP2007164253A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
JP2008154200A (ja) * 2006-12-14 2008-07-03 Samsung Electronics Co Ltd 動画像の字幕検出装置およびその方法
JP2008305099A (ja) * 2007-06-06 2008-12-18 Sharp Corp 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体
JP2009289075A (ja) * 2008-05-29 2009-12-10 Nippon Telegr & Teleph Corp <Ntt> 図形領域抽出装置、図形領域抽出方法、プログラム、及び記録媒体
JP2014147069A (ja) * 2013-01-29 2014-08-14 Sharp Corp 方向判定装置、方向判定方法、及びコンピュータ読み取り可能な記録媒体
CN111062317A (zh) * 2019-12-16 2020-04-24 中国计量大学上虞高等研究院有限公司 一种扫描文档的裁边方法与系统

Also Published As

Publication number Publication date
JP3544324B2 (ja) 2004-07-21

Similar Documents

Publication Publication Date Title
US11367282B2 (en) Subtitle extraction method and device, storage medium
US7787705B2 (en) Video text processing apparatus
JP4643829B2 (ja) ビデオフレーム中の検出されたテキストを使用してビデオコンテンツを分析するシステム及び方法
JP4489120B2 (ja) デジタル映像のアーティファクト削減
US20080095442A1 (en) Detection and Modification of Text in a Image
CN111695540B (zh) 视频边框识别方法及裁剪方法、装置、电子设备及介质
KR20010110416A (ko) 비디오 스트림 분류가능 심볼 고립 방법 및 시스템
KR20040050909A (ko) 이미지의 영역들간 판별을 위한 방법 및 장치
JPH05233873A (ja) 領域分割方法
CN111460355A (zh) 一种页面解析方法和装置
KR20080011050A (ko) 비디오 윈도우 검출기
JP2001076094A (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP2000182053A (ja) 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
CN108229476B (zh) 标题区域检测方法及系统
CN112818984B (zh) 标题生成方法、装置、电子设备和存储介质
JP4839076B2 (ja) 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
Zedan et al. Caption detection, localization and type recognition in Arabic news video
CN108363981B (zh) 一种标题检测方法及装置
Lee et al. Automatic person information extraction using overlay text in television news interview videos
KR101911613B1 (ko) 뉴스 인터뷰 영상의 오버레이 텍스트 기반 인물 인덱싱 방법 및 장치
Lee et al. Beginning frame and edge based name text localization in news interview videos
JPH10232926A (ja) 画像処理装置及びその方法
JP3488678B2 (ja) 画像分類装置
KR100845662B1 (ko) 비디오 자막영역 추출방법 및 장치
JPH0581475A (ja) 文字領域抽出方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040401

R150 Certificate of patent or registration of utility model

Ref document number: 3544324

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110416

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120416

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term