JP2004094967A - 文字領域判定方法および装置および記録媒体 - Google Patents

文字領域判定方法および装置および記録媒体 Download PDF

Info

Publication number
JP2004094967A
JP2004094967A JP2003358633A JP2003358633A JP2004094967A JP 2004094967 A JP2004094967 A JP 2004094967A JP 2003358633 A JP2003358633 A JP 2003358633A JP 2003358633 A JP2003358633 A JP 2003358633A JP 2004094967 A JP2004094967 A JP 2004094967A
Authority
JP
Japan
Prior art keywords
region
image
character
area
contrast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003358633A
Other languages
English (en)
Other versions
JP3825774B2 (ja
Inventor
Hidekatsu Kuwano
桑野 秀豪
Hiroyuki Arai
新井 啓之
Masaharu Kurakake
倉掛 正治
Toshiaki Sugimura
杉村 利明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003358633A priority Critical patent/JP3825774B2/ja
Publication of JP2004094967A publication Critical patent/JP2004094967A/ja
Application granted granted Critical
Publication of JP3825774B2 publication Critical patent/JP3825774B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

 【課題】 文字を含む画像中の文字領域の判別精度を向上させる文字領域判別方法および装置を提供する。
 【解決手段】 カラー画像入力記憶部1は、文字が含まれるカラー画像データを入力してメモリに記憶する。画像領域分割部2は、入力され記憶されたカラー画像を予め決めた方法を用いて連結画素領域に分割する。高コントラスト領域判定部3は、分割領域の領域境界部からエッジを検出し、周囲長とエッジ画素の比が閾値以上の領域を、文字を含んでいる可能性が高い高コントラスト領域として残し、それ以外の領域を低コントラスト領域として捨てる処理を行うことで、高精度に文字領域を判別する。これにより得られた文字領域画像を、文字領域画像蓄積部4に蓄積する。
 【選択図】 図1

Description

 本発明は、例えば、テレビ放送の映像等のカラー動画像を構成する複数のフレーム画像において、テレビ放送映像中のテロップ文字等の文字が表示されているフレーム画像の中から文字部分を画素連結領域として抽出する文字領域判定技術に関するものである。
 カラー動画像を構成する複数のフレーム画像の中の文字が表示されているフレーム画像、あるいは文字が表示されている静止カラー画像から文字部分を画素連結領域として抽出する文字領域判定技術に関しては、従来から多くの研究が行われている。
 非特許文献1で提案されている方法(以下、従来手法[1]と記す)は、最初に入力されたカラー画像を色空間の分割処理により、連結画素領域に分割し、その後、得られた領域に対し、文字領域かどうかの判別を行っている。従来手法[1]では、図6左に示すように、面積値が一定値以下の領域、画像の枠に接しない領域、および一定時間位置が変わらない領域を文字領域として判定している。
桑野、倉掛、小高:"映像データ検索のためのテロップ文字抽出法"、信学技報、PRMU96−98、pp.39−46、(1996−11)
 しかしながら、前記の従来手法[1]は、図6右に示すように、領域分割処理後の文字領域判定処理において、文字と同程度の面積を持ち、画像の枠に触れておらず、且つ一定時間位置が変わらない文字以外の領域を残留させてしまう問題がある。
 そこで、本発明は、例えば映像中において、文字と同程度の面積を持ち、画像の枠に触れておらず、且つ一定時間位置が変わらない文字以外の領域を削除することで、文字を含む画像中の文字領域の判別精度を向上させる文字領域判別方法および装置を提供することを課題とする。
 前記の課題を解決するために、本発明による文字領域抽出方法は、文字が表示されている画像を入力して原画像として記憶する第1の段階と、該第1の段階で入力され記憶された原画像を予め決めた方法を用いて、連結画素領域に分割し、領域分割画像を得る第2の段階と、該第2の段階で得られた領域分割画像中の各領域に対し、領域の境界に接する画素の輝度値を用いて領域境界部における領域の内側と領域の外側の明暗の差を表すコントラスト特徴を計算し、コントラスト特徴が予め設定した値より大きい領域を文字領域として該領域分割画像中に残し、そうでない領域を該領域分割画像中から削除する第3の段階と、該第3の段階で得られた文字領域として判定された全ての連結画素領域を含む文字領域画像を蓄積する第4の段階とを、有することを特徴とする。
 さらには、以上の文字領域判定方法における段階をコンピュータに実行させるためのプログラムを、該コンピュータが読み取り可能な記録媒体に記録したことを特徴とする。
 同じく前記の課題を解決するために、本発明による文字領域判定装置は、文字が表示されている画像を入力して原画像として記憶する画像入力記憶手段と、該画像入力記憶手段により入力され記憶された原画像を予め決めた方法を用いて、連結画素領域に分割し、領域分割画像を得る画像領域分割手段と、該画像領域分割手段により得られた領域分割画像中の各領域に対し、領域の境界に接する画素の輝度値を用いて領域境界部における領域の内側と領域の外側の明暗の差を表すコントラスト特徴を計算し、コントラスト特徴が予め設定した値より大きい領域を文字領域として該領域分割画像中に残し、そうでない領域を該領域分割画像中から削除する高コントラスト領域判定手段と、該高コントラスト領域判定手段により得られた文字領域として判定された全ての連結画素領域を含む文字領域画像を蓄積する文字領域画像蓄積手段と、該画像入力記憶手段、該画像領域分割手段、該高コントラスト領域判定手段および文字領域画像蓄積手段の実行順序を制御する制御手段とを、具備することを特徴とする。
 一般に映像中に表示される文字は周囲との輝度値コントラストが高い場合が多いという特徴を持つ。従来手法[1]では、領域の周囲の輝度コントラストは評価していないため、文字と同程度の面積を持ち、画像の枠に触れず、且つ一定時間位置が変わらない文字以外の領域のうち境界部の輝度コントラストが低い一般物体の領域も残留させてしまう。
 そこで、本発明では、領域分割後に各領域の境界部における輝度値のコントラスト特徴を計算し、コントラストの高い領域だけを残留させることで、文字領域の判別精度を向上させることを可能とする。
 以上の説明のとおり、本発明によれば、本発明では、領域分割後に各領域の境界部における輝度値のコントラスト特徴を計算し、コントラストの高い領域だけを残留させることで、文字領域の判別精度を向上させる効果が得られる。
 以下、図面を参照して本発明の実施形態例を詳細に説明する。
 図1は、本発明の一実施形態例による装置の構成とともに処理の流れを示すブロック図である。
 図1において、1はカラー画像入力記憶部であり、文字が表示されているカラー画像等の画像データを入力してメモリに記憶する。
 2は画像領域分割部であり、カラー画像入力記憶部1で入力され記憶されたカラー画像等の原画像を予め決めた方法(例えば、従来手法[1]で提案されている方法等)を用いて、連結画素領域に分割する。
 3は高コントラスト領域判定部であり、画像領域分割部2で得られた領域分割画像中の各領域に対し、領域境界部における輝度値のコントラスト特徴を計算し、コントラスト特徴が予め設定した値より大きい領域を文字領域として判別する。
 4は文字領域画像蓄積部であり、高コントラスト領域判定部により得られた文字領域画像を蓄積する。
 5は処理制御部であり、上記1〜4の各部の実行順序を制御する。
 図2は、図1中の高コントラスト領域判定部3の構成の一例とともに処理の流れの一例を示すブロック図である。
 図2において、6はエッジ検出部であり、カラー原画像等に対し予め決めた方法(例えば、Robinsonのエッジ検出用オペレータを用いて行う等)を用いて画像中のエッジ画素を検出する。
 7は領域周囲長計算部であり、領域分割画像中の各領域の内側の境界画素の個数を計算する。
 8は領域境界エッジ計算部であり、領域分割画像中の各領域の内側の境界画素のうちエッジ検出部6により得られたエッジ画素の個数を計算する。
 9は領域周囲長/エッジ比計算部であり、領域周囲長計算部7により得られた各領域の内側の境界画素の個数と領域境界エッジ計算部8により得られた各領域の内側の境界画素のうちのエッジ画素の個数の比を計算する。
 10は文字領域判定部であり、領域周囲長/エッジ比計算部9により得られた領域の内側境界における全周囲長とエッジ画素の個数の比が予め設定した値より大きい場合は該領域を文字領域として判別し該領域分割画像中に残し、そうでない場合は、該領域を背景ノイズ領域として該領域分割画像中から削除する。
 11は、上記6〜10の各部の実行順序を制御する処理制御部である。この処理制御部11は、図1の処理制御部5が兼ねる構成であってもよい。
 図3は、図2中の高コントラスト領域判定部3の処理の実施形態を説明するためのフローチャートである。
 図3において、ステップ(31)は、カラー原画像と領域分割画像をメモリ中に読み込む過程である。
 ステップ(32)は、原画像に対し、予め決められた方法(例えばRobinsonのエッジ検出用オペレータを用いて行う等)を用いてエッジ画素の検出を行う過程である。
 ステップ(33)は、領域分割画像中の領域数用の変数nを1に初期化する過程である。
 ステップ(34)は、変数nと領域分割画像中の領域の総数Nを比較し、nの値がN以下の場合はステップ(35)に移り、nの値がNより大きい場合は処理を終了する過程である。
 ステップ(35)は、領域分割画像中のn番目の領域について、領域の内側境界の画素の個数P(n)を計算する過程である。
 ステップ(36)は、ステップ(35)により得られたn番目の領域の内側境界画素のうち、ステップ(32)により得られたエッジ画素の個数Q(n)を計算する過程である。
 ステップ(37)は、ステップ(35)およびステップ(36)により求めたP(n)とQ(n)の比を計算し、得られた値が予め設定した値以上の場合、ステップ(38)に移り、そうでなければステップ(39)へ移る過程である。
 ステップ(38)は、P(n)とQ(n)の比が予め設定した値以上の場合、領域分割画像中のn番目の領域を文字領域として判断し、該領域分割画像中に残す過程である。
 ステップ(39)は、P(n)とQ(n)の比が予め設定した値より小さい場合、領域分割画像中のn番目の領域を背景ノイズ領域として判断し、該領域分割画像中から削除する過程である。
 ステップ(40)は、変数nを1だけインクリメントした後、ステップ(34)へ戻る過程である。
 図4は、本発明による効果を示す図である。本発明の主要な特徴点は、文字が含まれる映像等の原画像から、文字領域を抽出する処理において、原画像を領域分割し、領域境界部からエッジを検出して(図4−(a))、周囲長とエッジ画素の比が閾値以上である領域を、文字を含んでいる可能性が高い高コントラスト領域として残し、それ以外の領域を低コントラスト領域として捨てる処理を行うことにより、文字以外の領域(例えば、低コントラストの静止画領域)を削除し文字領域だけを高精度で残すことを可能とする(図4−(b))ものである。これによって、文字認識の精度を向上させることが可能となる。このような特徴的な構成が図2の6〜10の各部での処理であり、その処理の詳細が、図3のステップ(35)〜(39)での処理である。
 上記の実施形態例では、原画像としてカラー画像に適用した場合を例に説明したが、本発明は、(1)入力が二値化されている画像の場合、(2)二値化されていない普通の画像の場合のどちらの場合においても適用可能なものである。
 本発明がもっとも効果を奏するのは、図5に示すように、前処理として「文字領域抽出処理」を行った後に本発明の「文字領域判定処理」を行い、その後、さらに文字認識処理を行う構成においてである。
 なお、図1、図2で示した手段の一部もしくは全部を、コンピュータを用いて機能させることができること、あるいは、図1、図2、図3で示した処理のステップ(段階)をコンピュータで実行させることができることは言うまでもなく、コンピュータをその手段として機能させるためのプログラム、あるいは、コンピュータでその処理のステップを実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FD(フロッピー(登録商標)ディスク)や、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して提供し、配布することが可能である。
本発明の一実施形態例による文字領域判定装置の構成とともに処理の流れを示すブロック図である。 上記実施形態例における高コントラスト領域判定部の構成の一例とともに処理の流れの一例を示すブロック図である。 図1中の高コントラスト領域判定部3の処理実施の一例を示すフローチャートである。 (a),(b)は、本発明の実施形態例による文字領域判定結果の一例を示す図である。 本発明の効果が最もよく発揮される適用例を説明する図である。 従来手法[1]による文字領域判別結果の一例を示す図である。
符号の説明
 1…カラー画像入力記憶部
 2…画像領域分割部
 3…高コントラスト領域判定部
 4…文字領域画像蓄積部
 5…処理制御部
 6…エッジ検出部
 7…領域周囲長計算部
 8…領域境界エッジ計算部
 9…領域周囲長/エッジ比計算部
 10…文字領域判定部
 11…処理制御部

Claims (3)

  1. 文字が表示されている画像を入力して原画像として記憶する第1の段階と、
    該第1の段階で入力され記憶された原画像を予め決めた方法を用いて、連結画素領域に分割し、領域分割画像を得る第2の段階と、
    該第2の段階で得られた領域分割画像中の各領域に対し、領域の境界に接する画素の輝度値を用いて領域境界部における領域の内側と領域の外側の明暗の差を表すコントラスト特徴を計算し、コントラスト特徴が予め設定した値より大きい領域を文字領域として該領域分割画像中に残し、そうでない領域を該領域分割画像中から削除する第3の段階と、
    該第3の段階で得られた文字領域として判定された全ての連結画素領域を含む文字領域画像を蓄積する第4の段階と、
    を有することを特徴とする文字領域判定方法
  2. 文字が表示されている画像を入力して原画像として記憶する画像入力記憶手段と、
    該画像入力記憶手段により入力され記憶された原画像を予め決めた方法を用いて、連結画素領域に分割し、領域分割画像を得る画像領域分割手段と、
    該画像領域分割手段により得られた領域分割画像中の各領域に対し、領域の境界に接する画素の輝度値を用いて領域境界部における領域の内側と領域の外側の明暗の差を表すコントラスト特徴を計算し、コントラスト特徴が予め設定した値より大きい領域を文字領域として該領域分割画像中に残し、そうでない領域を該領域分割画像中から削除する高コントラスト領域判定手段と、
    該高コントラスト領域判定手段により得られた文字領域として判定された全ての連結画素領域を含む文字領域画像を蓄積する文字領域画像蓄積手段と、
    該画像入力記憶手段、該画像領域分割手段、該高コントラスト領域判定手段および文字領域画像蓄積手段の実行順を制御する制御手段と、
    を具備することを特徴とする文字領域判定装置
  3.  請求項1記載の文字領域判定方法における段階をコンピュータに実行させるためのプログラムを、該コンピュータが読み取り可能な記録媒体に記録したことを特徴とする記録媒体
JP2003358633A 2003-10-20 2003-10-20 文字領域判定方法および装置および記録媒体 Expired - Lifetime JP3825774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003358633A JP3825774B2 (ja) 2003-10-20 2003-10-20 文字領域判定方法および装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003358633A JP3825774B2 (ja) 2003-10-20 2003-10-20 文字領域判定方法および装置および記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP36365198A Division JP3504874B2 (ja) 1998-12-22 1998-12-22 文字領域判定方法および装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2004094967A true JP2004094967A (ja) 2004-03-25
JP3825774B2 JP3825774B2 (ja) 2006-09-27

Family

ID=32064637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003358633A Expired - Lifetime JP3825774B2 (ja) 2003-10-20 2003-10-20 文字領域判定方法および装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3825774B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117690142A (zh) * 2024-02-01 2024-03-12 深圳中科精工科技有限公司 晶圆字符的预处理方法、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117690142A (zh) * 2024-02-01 2024-03-12 深圳中科精工科技有限公司 晶圆字符的预处理方法、设备及存储介质
CN117690142B (zh) * 2024-02-01 2024-05-28 深圳中科精工科技有限公司 晶圆字符的预处理方法、设备及存储介质

Also Published As

Publication number Publication date
JP3825774B2 (ja) 2006-09-27

Similar Documents

Publication Publication Date Title
CN112990191B (zh) 一种基于字幕视频的镜头边界检测与关键帧提取方法
CN108882057B (zh) 视频摘要生成方法及装置
US9262684B2 (en) Methods of image fusion for image stabilization
CN106937114B (zh) 用于对视频场景切换进行检测的方法和装置
JP6377025B2 (ja) 文書画像における縦線および横線の検出および削除
JP2008527525A (ja) グラフィカルなオブジェクトを検出するための方法及び電子装置
JP2012517647A (ja) 前景−背景制約伝播に基づくビデオマッティング
JP2008520152A (ja) 画像中のテキストの検出および修正
JP5445467B2 (ja) クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム
CN110996183B (zh) 视频摘要的生成方法、装置、终端及存储介质
EP3376470B1 (en) Moving body tracking method, moving body tracking device, and program
JP2007034733A (ja) 対象物領域検出装置、方法およびプログラム
JP4860574B2 (ja) 文字切り出し装置、方法およびプログラム
US9064179B2 (en) Region extraction apparatus, region extraction method, and computer program product
JP2013502147A (ja) 画像シーケンスの関心領域に基づくアーティファクト低減のためのシステム及び方法
US20180089529A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2856207B1 (ja) 画像位置調整装置及び画像位置調整プログラムを記録したコンピュータが読み取り可能な記録媒体
JP2004094967A (ja) 文字領域判定方法および装置および記録媒体
KR101822443B1 (ko) 샷 경계 및 자막을 이용한 동영상 축약 방법 및 처리 장치
JP5158974B2 (ja) 注目領域抽出方法、プログラム、及び、画像評価装置
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP2009044739A (ja) デジタル画像の背景色を決定するための方法およびシステム
JP2008503828A (ja) ブロック型画像処理のための方法及び電子装置
CN108304825B (zh) 一种文本检测方法及装置
JP2000187732A (ja) 文字領域判定方法および装置およびこの方法を記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060630

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100707

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110707

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130707

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term