JP4861845B2 - テロップ文字抽出プログラム、記録媒体、方法及び装置 - Google Patents

テロップ文字抽出プログラム、記録媒体、方法及び装置 Download PDF

Info

Publication number
JP4861845B2
JP4861845B2 JP2007025259A JP2007025259A JP4861845B2 JP 4861845 B2 JP4861845 B2 JP 4861845B2 JP 2007025259 A JP2007025259 A JP 2007025259A JP 2007025259 A JP2007025259 A JP 2007025259A JP 4861845 B2 JP4861845 B2 JP 4861845B2
Authority
JP
Japan
Prior art keywords
image
character
telop
luminance
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007025259A
Other languages
English (en)
Other versions
JP2008191906A (ja
Inventor
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007025259A priority Critical patent/JP4861845B2/ja
Priority to US12/021,611 priority patent/US7961948B2/en
Publication of JP2008191906A publication Critical patent/JP2008191906A/ja
Application granted granted Critical
Publication of JP4861845B2 publication Critical patent/JP4861845B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Description

本発明は、ビデオ映像中のテロップ文字をビデオ検索テキストなどに利用するために抽出するテロップ文字抽出プログラム、記録媒体、方法及び装置に関し、特に、文字認識に使用される2値の文字パターンをビデオ映像中のテロップ領域から抽出するテロップ文字抽出プログラム、記録媒体、方法及び装置に関する。
近年、多チャンネルを対象に、多数の番組を録画できるDVD装置やHDDビデオ装置が普及している。その結果、録画した大量のビデオの中から好みにあったコンテンツを検索するニーズが高まってきている。
このような大量のビデオを検索するためには、ビデオ映像中のテロップ文字を自動的に抽出してテキスト化する必要がある。
従来のテロップ文字を抽出してテキスト化する方法としては、テロップ文字がフレーム画像の中で最も高輝度であることを仮定し、テロップ領域の中から輝度分布の最も高いピークの部分の画素だけを抽出してテロップ文字パターンとして出力している(特許文献1)。
また別の方法にあっては、様々な手法で候補パターンを作成し、それぞれの候補パターンを文字認識し、文字認識に至るまでの認識信頼度によって特定の候補パターンをテロップ情報として選択している(特許文献2)。また、この方法にあっては、テロップ文字を構成する画素を背景から抽出する処理として、エッジ膨張領域の輝度ヒストグラムを求め、テロップ、テロップの縁および背景について輝度ピークを求め、ピークが最も高くなる分布をテロップ文字の分布として候補パターンを抽出している。
特開2000−182053号公報 特開2001−285716号公報
しかしながら、特許文献1のテロップ文字抽出にあっては、テロップ文字はフレーム画像の中で最も高輝度であることを仮定して抽出しているため、低輝度のテロップ文字は認識できないという問題がある。
特許文献2によるテロップ文字の抽出は、テロップ領域に対し得られた複数の候補パターンの文字認識結果から認識信頼度によってテロップ情報を選択しており、フレーム画像から文字認識ために1つのテロップ文字パターンを抽出するというものではなく、処理が煩雑になるという問題がある。
また特許文献2の方法は、テロップ文字を構成する画素を背景から抽出するため、エッジ膨張領域の輝度ヒストグラムにおいてピークが最も高くなる分布をテロップ文字の分布として抽出しており、この結果、低輝度のテロップ文字は認識できないという問題がある。
本発明は、テロップ文字の輝度に依存せず、低輝度や中輝度のテロップ文字であっても、高精度にテロップ文字パターンを抽出して認識率を向上できるテロップ文字抽出プログラム、記録媒体、方法及び装置を提供することを目的とする。
(プログラム)
本発明はテロップ文字抽出プログラムを提供する。本発明のテロップ文字抽出プログラムは、コンピュータに、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させることを特徴とする。
ここで、エッジ領域抽出部は、
グレースケール画像からエッジを抽出したエッジ画像を生成し、
エッジ画像を2値化してエッジ2値画像を生成し、
エッジ2値画像のエッジ画素を膨張させてエッジ領域画像を生成する。
輝度ヒストグラム作成部は、輝度ヒストグラムを作成した後に、各輝度のヒストグラム値として、隣接する複数の輝度のヒストグラム値との平均値を算出して平滑化する。
輝度クラス生成部は、
輝度ヒストグラムの輝度軸上に1又は複数の閾値を設定して分割した輝度クラスもつ複数種類の輝度ヒストグラムを生成し、
複数種類の輝度ヒストグラムについて、閾値上のヒストグラム値の平均値を比較し、平均値が最小となる輝度ヒストグラムを選択する。
輝度クラス生成部は、例えば、
輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラム生成し、
輝度クラスを2分割した第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択する。
文字パターン候補選択部は、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
2値ラベル画像に含まれる文字パターンの中からテロップ領域画像の外周に接している文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値ラベル画像をテロップ文字候補画像として選択する。
文字パターン候補選択部は、クラス毎に求めた2値画像の面積に大きな差がない場合、各クラスの2値画像毎に線密度を算出し、線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択する。
ここで、線密度は、2値画像の行毎に背景画素から文字画素への変化点の数を求めた総和を、2値画像の行数で割った値である。
ノイズ除去部は、
テロップ文字画像と原画であるテロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
テロップ文字候補画像から最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成する。
この場合の最大頻度色の抽出は、
文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
カウントが最大となる小立方体に属する色を最大頻度色として抽出する。
ノイズ除去部は、別の形態として、
テロップ文字画像と原画であるテロップ領域画像との論理積をとって文字色画像を生成し、
文字色画像から全体平均色を求めると共に、2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
ノイズ判定値が所定の閾値より大きな文字パターンをノイズとしてテロップ文字候補画像から除去してテロップ文字画像を生成する。
(記録媒体)
本発明は、ロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体を提供する。本発明の記録媒体は、コンピュータに、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を多値化して複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラムを格納したことを特徴とする。
(方法)
本発明はテロップ文字抽出方法を提供する。本発明のテロップ文字抽出方法は、
カラー映像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成ステップと、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去ステップと、
を備えたことを特徴とする。
(装置)
本発明はテロップ文字抽出装置を提供する。本発明のテロップ文字抽出装置は、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
エッジ領域画像をマスク画像としてグレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
テロップ文字候補画像に対応してテロップ領域画像で使われている文字色を判定し、文字色に該当する文字画素をテロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を備えたことを特徴とする。
本発明によれば、テロップ文字のエッジ近傍の輝度ヒストグラムを生成して複数の輝度クラスに分割し、各輝度クラス毎に2値画像を生成して画素面積が最大となるテロップ文字画像を選択することで、テロップ文字が存在する輝度のピーク分布を相対的に求めることができる。
このため、テロップ領域に散在する高輝度のテロップ文字に加え、低輝度または中輝度のテロップ文字であっても高精度に抽出することができ、テキスト化のためのテロップ文字の認識率を高めることができる。
図1は本実施形態のテロップ文字抽出装置における機能構成を示したブロック図である。図1において、本実施形態のテロップ文字抽出装置は、テロップ文字抽出処理部10、映像ファイル12、記憶部14で構成されている。
映像ファイル12には、処理対象とするテロップ画像を含むフレーム画像の集合でなるビデオやDVDなどの映像、例えばMPEG2などの映像が格納されている。
テロップ文字抽出処理部10には、画像入力部16、グレースケール画像生成部18、エッジ領域抽出部20、輝度ヒストグラム作成部22、輝度クラス生成部24、文字パターン候補選択部26、ノイズ除去部28及びテロップ文字出力部30の機能が設けられている。これらの機能は本実施形態のテロップ文字抽出プログラムをコンピュータにより実行することにより実現される機能である。
記憶部14にはテロップ文字抽出処理部10の各機能で生成処理されるデータとして、処理順に、テロップ領域画像32、グレースケール画像34、エッジ領域画像36、輝度ヒストグラム38、輝度クラス別2値画像40、テロップ文字候補画像42及びテロップ文字画像44が格納生成される。
テロップ文字抽出処理部10で抽出されたテロップ文字画像は文字認識部46に出力され、OCR処理により文字認識されてテキスト化される。
次にテロップ文字抽出処理部10の各機能を説明する。画像入力部16は、映像ファイル12のカラー画像であるフレーム画像から切り出されたテロップ文字を含むテロップ領域画像32を入力し、記憶部14に格納する。
カラー画像からのテロップ文字領域画像の切出しは、テロップ文字を含む領域の自動切出しあるいはユーザによる領域指定で切り出すことができる。テロップ領域画像の自動切出しとしては、例えばビデオストリームの先頭部分における複数フレームの中の輝度変化のない部分を含む領域を矩形に切り出して、テロップ画像として入力すればよい。
グレースケール画像生成部18は、テロップ領域画像32からグレースケール画像を生成する。テロップ領域画像32の各画素はRGBデータで構成されているため、グレースケール画像34の生成は例えば次式で作成する。

G=r*0.299+g*0.587+b:0.114 (1)
エッジ領域抽出部20は、グレースケール画像34からエッジを抽出して膨張させたエッジ領域画像36を生成する。輝度ヒストグラム作成部22は、エッジ領域画像36をマスク画像として、グレースケール画像34のマスク画像に属する画素の輝度ヒストグラム38を生成する。
輝度クラス生成部24は、輝度ヒストグラムの輝度を1又は複数の閾値の設定により多値クラス化して複数の輝度クラスに分割する。本実施形態にあっては、輝度ヒストグラムを2クラス化または3クラス化している。2クラス化した場合は、低輝度及び高輝度クラスに2分割し、3クラス化した場合には、低輝度クラス、中輝度クラス、高輝度クラスに3分割する。
文字パターン候補選択部26は、ヒストグラムに対し分割した輝度クラス毎に、各クラスに属する輝度の画素を集めた輝度クラス別2値画像40を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像42として選択する。
ノイズ除去部28は、テロップ文字候補画像42に対応してテロップ領域画像32で使われている文字色を判定し、判定した文字色に該当する文字画像をテロップ文字候補画像から抽出することにより、判定した文字色以外の文字画素をノイズ画素として除去し、2値画像データであるテロップ文字画像44を生成する。
テロップ文字出力部32は、ノイズ除去部28により生成されたテロップ文字画像44を文字認識部46に出力してOCR処理によりテキスト化し、図示しないビデオファイルの検索に利用する。
図2は図1のテロップ文字抽出処理部10の各機能を実現する本実施形態のプログラムが実行されるコンピュータのハードウェア環境を示したブロック図である。
図2のコンピュータにおいて、CPU48のバス50には、RAM52、ROM54、ハードディスクドライブ56、キーボード60,マウス62,ディスプレイ64を接続するデバイスインタフェース58、及びネットワークアダプタ66が接続される。
ハードディスクドライブ56には本実施形態によるテロップ文字抽出プログラムをローディングしており、コンピュータを起動すると、ROM54のBIOSによるブートアップでOSがRAM52に読出し配置され、続いて、OSの実行によりハードディスクドライブ56から本実施形態のテロップ文字抽出プログラムがハードディスクドライブ56から読み出されてRAM52に配置され、CPU48により実行される。
図3は図1の実施形態によるテロップ文字抽出処理の手順を示したフローチャートであり、同時に本実施形態のテロップ文字抽出処理プログラムの内容を表している。
図3において、テロップ文字抽出処理は、まずステップS1で画像入力部16により映像ファイル12から切り出したテロップ領域画像を入力し、記憶部14にテロップ領域画像32として格納する。続いてステップS2で、グレースケール画像生成部18が、前記(1)式に従ってテロップ領域画像のRGB画像データからグレースケール画像34を生成する。
続いてステップS3で、エッジ領域抽出部20がグレースケール画像からエッジを抽出して膨張させたエッジ領域画像36を生成する。次にステップS4で、輝度ヒストグラム作成部22がエッジ領域画像36をマスク画像としてグレースケール画像34のマスク画像に属する画素の輝度ヒストグラム38を作成する。
次にステップS5で輝度クラス生成部24が輝度ヒストグラム38の輝度を多値クラス化して、例えば2クラスまたは3クラスに分割した輝度クラスを生成する。
続いてステップS6で、文字パターン候補選択部26が輝度クラスごとに各クラスに属する輝度の画素を集めた輝度クラス別2値画像40を生成し、生成した2値画像の面積即ち文字画素数が最大となるクラスの2値画像をテロップ文字候補画像42として選択する。
続いてステップS7で、ノイズ除去部28がテロップ文字候補画像42に対応してテロップ領域画像32で使われている文字色を判定し、判定した文字色に該当する文字画像をテロップ文字候補画像から抽出し、それ以外の文字色の画素についてはノイズ画素として除去し、テロップ文字画像44を生成する。最終的にステップS8で、テロップ文字出力部30が抽出した文字画像を出力して文字認識によりテキスト化させるようになる。
図4は図3のステップS3におけるエッジ近傍領域抽出処理の詳細を示したフローチャートである。本実施形態で抽出対象とするテロップ文字は、通常、文字パターンの周囲に縁取り(ボーダ)が施されている。これはテロップ文字が背景上にスーパーインポーズされるため、視聴者が見易いように付けられている。もちろん、場合によっては縁取りのない文字パターンも存在する。
このようなテロップ文字を正しく抽出するためには、文字パターン、縁取り及び背景を区別する必要がある。このような区別を画像全体を使用して行うと、背景部分が圧倒的に多く、且つ背景は様々な色や模様が存在するため、文字パターンを抽出するための背景の特性を正しく抽出することができない。そこで本実施形態にあっては、文字パターンの周囲だけに注目したエッジ近傍領域の抽出を行う。
図4のエッジ近傍領域抽出処理にあっては、ステップS1でSobelフィルタによりグレースケール画像からエッジを抽出したエッジ画像を生成する。続いてステップS2でエッジ画像を2値化してエッジ2値画像を生成する。続いてステップS3でエッジを所定画素数だけ水平及び垂直方向に膨張させて、エッジ領域画像である膨張画像を生成する。
ここで、ステップS1のエッジ抽出には公知のSobelフィルタを使用している。このフィルタは一般にエッジ検出に利用されるフィルタであり、ある注目画素を中心とした上下9つの画素に対し、所定の係数をそれぞれ乗算し、結果を合計するものである。
図5は図4のエッジ近傍領域抽出処理における処理画像の具体例を示している。図5(A)はテロップ領域画像68であり、テロップ文字として「勝山裕」が含まれている。
図5(B)はテロップ領域画像68に前記(1)式を適用して生成したグレースケール画像70である。このグレースケール画像70に対し、図4のステップS1に示したように、Sobelフィルタによるエッジ抽出を行って2値化すると、図5(C)のようなエッジ2値画像72が生成される。
そして図4のステップS3で、エッジ2値画像72の白画素で示すエッジ画像を膨張することで、図5(D)に示す膨張画像74を生成する。この膨張画像74におけるエッジ近傍領域は白画素で示す領域である。
図6は図3のステップS4におけるヒストグラム作成処理の詳細を示したフローチャートである。図6において、ヒストグラム作成処理は、まずステップS1で、図5(D)に示したような膨張画像74のエッジ近傍領域(白画素領域)をマスク画像として、図5(B)のようなグレースケール画像70のマスク画像内に含まれる画素につき、すべての画素に対して、画素の輝度とその頻度を数え上げて、輝度ヒストグラムを作成する。
図7(A)は、図5(D)の膨張画像74をマスク画像として、図5(B)のグレースケール画像70の画素の輝度値から得られた輝度ヒストグラム76を示している。
続いて図6のステップS2で移動平均によるヒストグラムの平滑化を行う。この平滑化は、図8に示すように、平滑前頻度値80が横方向の輝度値に対し得られていたとすると、注目している輝度と、これに隣接する両側の輝度を含む3つの頻度における頻度の平均値を横方向に1つずつ輝度をずらしながら移動平均として算出する。
例えば左端からの3つの輝度値に対応した頻度「3.0,6.0,2.0」については、この3つの頻度の平均値「3.7」を求め、これを中央の輝度における頻度の値として平滑化後頻度値82にセットする。
次の左から3番目の輝度値の頻度「2.0」についても、両側に位置する輝度値の頻度「6.0,7.0」との平均により頻度「5.0」を求め、これを平滑化後頻度値82に格納する。
以下同様に、右側に輝度を1つずらしながら3つの輝度の頻度の移動平均を求める。なお左端となる先頭の輝度における頻度「3.0」については、隣接する輝度が右側の1つしかないため、この場合には2つの隣接する輝度の頻度値「3.0,6.0」の平均値から、平滑化後頻度値82として「4.5」を求めている。
この図8に示すような移動平均による平滑化を行うと、図7(A)の平滑化前の輝度ヒストグラム76は、図7(B)のように平滑化後の輝度ヒストグラム78となり、滑らかな変化を持った輝度ヒストグラムとすることができる。
図9は図3のステップS5における輝度クラス生成処理の詳細を示したフローチャートである。本実施形態の輝度クラス生成処理にあっては、図5(A)に示したようなテロップ領域画像68に含まれるテロップ文字の輝度が高輝度のみならず、低輝度や中輝度である場合も考慮し、輝度に依存することなく高精度にテロップ文字を抽出可能とするため、輝度ヒストグラムの多値クラス化を行っている。
図9において、輝度クラス生成処理は、図7(B)のように平滑化した輝度ヒストグラム78を対象に、輝度軸方向におけるヒストグラムの多値クラス化として、本実施形態にあっては2クラス化と3クラス化をするための輝度の閾値を導出する。
この輝度クラス化にあっては、テロップ文字に輪郭が付いていれば2クラス化が望ましく、輪郭が付いていなければ3クラス化が望ましい。この2クラス化または3クラス化をするための閾値の導出には、例えば大津の方法(大津展乃著、電子技術総合研究所(Electrotechnical Laboratory,論文番号:昭 55−210[D−53])として知られた「判別および最小二乗規準に基づく自動しきい値選定法」を使用する。
図10は本実施形態における2クラス化と3クラス化した輝度ヒストグラムの説明図である。図10(A)は2クラス化したヒストグラムであり、大津の方法に従って求めた閾値TH1を設定することで、閾値TH1より低い低輝度クラス84−1と、それより高い高輝度クラス84−2に分割している。
図10(B)は3クラス化した輝度ヒストグラムであり、大津の方法により導出した2つの閾値TH2,TH3を設定することで、低輝度クラス86−1,中輝度クラス86−2及び高輝度クラス86−3に分割している。
この図10(A)(B)に示すように、輝度ヒストグラムを2クラス化または3クラス化した場合、いずれのクラス化が最適かを決めるため、図9のステップS2で3クラス化の2つの輝度閾値TH2,TH3における頻度h3L,h3Rの平均値
(h3L+h3R)/2
を算出する。
続いてステップS3で、ステップS2で求めた3クラス化の閾値頻度の平均値が図10(A)の2クラス化の閾値TH1上の頻度h2より小さいか否か判別する。小さければステップS4に進み、最適なクラス化として3クラス化を選択する。2クラス化の閾値TH1上の頻度h2のほうが大きければステップS5に進み、最適クラス化として2クラス化を選択する。
図11は図3のステップS6における文字パターン候補選択処理の詳細を示したフローチャートである。図11において、文字パターン候補選択処理は、ステップS1で図9の輝度クラス生成処理で2クラス化が選択されたか否かチェックする。
2クラス化が選択された場合には、ステップS2の処理に進む。一方、3クラス化が選択された場合には、ステップS11の3クラス化候補抽出処理に進む。ステップS11の3クラス化候補抽出処理の詳細は図12のフローチャートに示している。
ステップS1で2クラス化の選択を判別した場合には、ステップS2で図5(B)に示したテロップ領域画像に対応したグレースケール画像70から図10(A)の低輝度クラス84−1に属する輝度値の画素だけを集めた2値画像を作成する。
即ち、ある画素が閾値TH1より小さい場合はその画素にビット1をセットし、それ以外はビット0をセットすることで、低輝度クラスの2値画像を作成する。
続いてステップS3で、同じグレースケール画像から図10(A)の高輝度クラス84−2に属する輝度値の画素だけを集めた高輝度クラスの2値画像を作成する。
次にステップS4で各クラスの2値画像の連続画素に同一ラベルを付けたラベル画像を作成する。このラベル付けにより、テロップ領域に含まれる連続画素群からなる文字パターンごとに異なったラベル番号が付けられることになる。
続いてステップS5で、ラベル画像を対象にテロップ領域の外周に接しているパターン(同一ラベル番号を持つ画素群)のラベル画素をノイズ画素として除去する。具体的には、外周に接しているパターンの画素値「1」を「0」に変更することで除去する。
続いてステップS6で、低輝度クラスと高輝度クラスの2値画像における有効画素の面積、即ち画素数を算出する。ステップS7で低輝度クラスと高輝度クラスの2値画像の有効画像の面積に大きな面積差があれば、ステップS8に進み、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する。
一方、低輝度クラスと高輝度クラスの2値画像における有効画像の面積に大きな差がない場合には、ステップS9に進み、各クラスの2値画像の線密度を算出する。2値画像の線密度は、2値画像の行ごとに背景画素「0」から文字画像「1」への変換点の数を求め、その総和を、2値画像の行数で割った値として算出する。
この2値画像の線密度は、文字パターンについては画像値「1」となる有効画像がある程度まとまる形を持ち、これに対しノイズ画像は文字パターンに比べ行方向の変化数が少ないことから、文字パターン線密度は小さい値を取ることになる。
そこでステップS10に進み、線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択する。
図12の3クラス化候補抽出処理にあっても、図11のステップS2〜S10に示した2クラス化候補選出処理と基本的に同じであるが、3クラス化の場合には低輝度クラス,中輝度クラス及び高輝度クラスの3クラスに分けて2値画像を生成している点が相違する。
図12の3クラス化候補抽出処理を、図13の3クラス化候補抽出処理における処理画像を示した説明図を参照して説明すると、次のようになる。
まずステップS1で、テロップ領域画像に対応したグレースケール画像から図13の輝度ヒストグラム78における低輝度クラス86−1に属する輝度値の画素だけを集めた低輝度クラスの2値画像を作成する。
続いてステップS2で、中輝度クラス86−2に属する画素だけを集めた中輝度クラスの2値画像を作成する。更にステップS3で、高輝度クラス86−3に属する輝度値の画素だけを集めた高輝度クラスの2値画像を作成する。
このステップS1〜S3の処理により、図13に示す低輝度クラス86−1の2値画像90−1、中輝度クラス86−2の2値画像90−2及び高輝度クラス86−3の2値画像90−3が作成される。
続いてステップS4で、各クラスの2値画像の連続画素に同一ラベルを付したラベル画像を作成する。これは図13の各クラスごとのラベル画像92−1,92−2,92−3のようになる。なお図13の2値ラベル画像92−1,92−2,92−3については、同一ラベル番号を付したパターンについて同じ濃淡明度で表している。
続いてステップS5で、各クラスのラベル画像につきテロップ領域の外周に接しているパターンのラベル画像をノイズとして除去する。このテロップ領域の外周に接しているパターンのラベル画像を除去することで、図13のノイズ除去2値画像94−1,94−2,94−3が得られる。
図14は図13の低輝度クラス86−1における処理画像を拡大して示している。図14において、低輝度クラス86−1に属する輝度値の画素を集めた2値画像90−1にあっては、白画像で示す部分に複数の文字パターン96−1〜96−8が存在している。
このような2値画像90−1につき、連続画素に同一ラベルを付けて2値ラベル画像92−1を作成する。ラベル付けは、2値画像90−1における文字パターン96−1〜96−8のそれぞれに異なるラベル番号を割り当て、同じパターンに属する画素にはすべて割り当てた同じラベル番号を付することになる。
このようにして生成した2値ラベル画像90−1につき、テロップ領域の外周に接しているラベルパターン98−1,98−2,98−8をノイズとして除去し、ノイズ除去2値画像94−1を生成している。
再び図12を参照するに、ステップS5でテロップ領域の外周に接しているパターンのラベル画像の除去が済んだならば、ステップS6で各クラスの2値画像における有効画像の面積(画素数)を算出する。
図13の場合には、低輝度クラス及び中輝度クラスのノイズ除去2値画像94−1,94−2の文字パターンの面積に対し、高輝度クラス86−3のノイズ除去2値画像94−3の有効画像面積が十分に大きいことになる。
このように各クラスの2値画像に大きな面積差があった場合には、ステップS7からステップS8に進み、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する。即ち図13の場合には、高輝度クラス86−3のノイズ除去2値画像94−3がテロップ文字候補画像として選択される。
一方、ステップS7で各クラスの2値画像における有効画像の面積に大きな面積差がなかった場合には、ステップS9で各クラスの2値画像の線密度を算出し、ステップS10で線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択する。
図15は図3のステップS7におけるノイズ除去処理の詳細を示したフローチャートであり、この実施形態にあっては、最大頻度色の抽出に基づいてノイズを除去するようにしたことを特徴とする。
図15において、ノイズ除去処理は、まずステップS1でテロップ文字候補画像(2値画像)と、原画像である図5(A)に示したテロップ領域画像68との論理積により文字色画像を生成する。例えば図16に示すように、テロップ文字候補画像94−3と原画像であるテロップ領域画像68の論理積102を求めて文字色画像104を生成する。
続いてステップS2で文字色画像からRGBの3次元カラーヒストグラムを生成する。続いてステップS3でRGB空間の各座標軸のn分割、例えばn=16分割して小立方体に量子化する。即ち、RGB空間は各軸が0〜255の256レベルの立方体であるが、この各軸をn=16分割して量子化した(16×16×16)個の小立方体を作成する。
次にステップS4で、小立方体に属する色の画像数(カウント)を周囲の重み付けにより算出する。即ち、ある小立方体に注目した場合、その立方体の周囲に存在する26個の小立方体の画素数を比較し、周囲より画素数が大きいか同じ小立方体だけを対象に、周囲にある小立方体の画素数をすべて合計した値を、注目している小立方体の画素数とする。
続いてステップS5で、最大画像数の小立方体を最大頻度色の文字色として抽出する。続いてステップS6で、テロップ文字の候補画像より最大頻度色の小立方体に含まれる文字色を持つパターンを文字部分として抽出し、最大頻度色に属さない色を持つパターンをノイズとして除去する。
例えば図17にあっては、テロップ文字候補パターン94−3について、図16の文字色画像104から得られた最大画素数の小立方体の最大頻度色に属する文字色を抽出することで、最大頻度色に属さない色彩を持つパターン105がノイズとして除去され、テロップ文字画像106を抽出することができる。
このようにして生成されたテロップ文字画像106は、図1に示したように必要に応じて文字認識部46に出力され、OCR処理により2値画像であるテロップ文字画像106から文字コードが認識され、検索のためのテキスト化を行うことができる。
図18は図3のステップS7におけるノイズ除去処理の他の実施形態を示したフローチャートであり、この実施形態のノイズ除去処理にあっては、平均色を抽出してノイズパターンを除去するようにしたことを特徴とする。
図18のノイズ除去処理において、まずステップS1で、図16に示したようにテロップ文字候補画像94−3と、原画像であるテロップ領域画像68との論理積102による文字色画像104を生成する。
続いてステップS2で文字色画像104の全体の平均色を算出する。このようにして算出される文字画像全体の平均色を
(r_mean,g_mean,b_mean)
とする。
続いてステップS3で文字色画像104における2値ラベル画像の各ラベル番号領域毎に平均色と面積(画素数)を算出する。このとき使用するラベル画像としては、図13の高輝度クラス86−3について生成している2値ラベル画像92−3を利用する。
ステップS3で算出される2値ラベル画像における各ラベル番号の領域毎の平均色を、例えばラベル番号=1の場合には平均色(r1,g1,b1)として求め、またラベル番号=1の領域の面積を(count)として求める。
続いてステップS4で全体平均色と領域平均色との差を面積で重み付けした判定値を算出する。ここで判定値をvalueとすると次式で算出される。
value= │r_mean−r1│*count+
│g_mean−g1│*count+
│b_mean−b1│*count
ステップS5で算出される判定値(value)は、ラベル領域の面積が大きいほど、また全体の平均色との色の違いが大きいほど、大きな値を取ることになる。
したがって、次のステップS5で判定値(value)が予め定めた閾値より大きい領域があるか否か判別し、閾値より大きい領域がある場合にはステップS6に進み、テロップ文字候補画像の対応する領域をノイズ領域として除去する。
以上の実施形態はテロップ文字として日本語の処理を例に取るものであったが、日本語以外の文字、例えば英文テロップ文字についても、まったく同様にして本発明によるテロップ文字抽出処理を適用して、高輝度のみならず低輝度や中輝度のテロップ文字であっても、高精度に抽出することができる。
図19は英文テロップ文字を対象とした本実施形態による図4のエッジ近傍領域抽出処理に伴う処理画像である。図19(A)は英文テロップ文字「Yutaka」を含むテロップ領域画像108であり、このテロップ領域画像108につき、前記(1)式により図19(B)のグレースケール画像110を求める。
このようにして求めたグレースケール画像110につき、図4のステップS1でSobelフィルタによりエッジ抽出を行い、図19(C)に示すエッジ2値画像112を生成する。続いてエッジ2値画像112を対象に、図4のステップS3でエッジ画像を膨張して、図19(D)の膨張画像114を生成する。この膨張画像114にあっては、エッジ近傍領域が白画素で示される領域となっている。
図20は英文テロップ文字を対象とした図12の3クラス化候補抽出処理における処理画像を示している。英文テロップ文字を対象とした場合にも、例えば3クラス化した輝度ヒストグラム78において、低輝度クラス86−11、中輝度クラス86−12、高輝度クラス86−13につき、それぞれ各クラスの2値画像116−1,116−2,116−3を生成した後、連続画像に同一ラベル番号を付けるラベリングを行って2値ラベル画像118−1,118−2,118−3を生成し、続いてテロップ領域の外周に接しているパターンのラベル画素をノイズ画素として除去し、ノイズ除去2値画像120−1,120−2,120−3を生成している。
そして各クラスのノイズ除去2値画像120−1〜120−3における有効画素数の面積(画素数)を算出し、この場合には大きな面積差があることから、面積が最大となる高輝度クラス86−13のノイズ除去2値画像120−3をテロップ文字候補画像として選択する。
このようにして選択された英文テロップ文字を対象としたテロップ文字候補画像120−3につき、例えば図15に示した最大頻度色に基づくノイズ除去を行うと、図21のようにテロップ文字候補画像120−3と原画像であるテロップ領域画像108との論理積124を取ることで文字色画像126を生成する。
そして、この文字色画像126からRGB3次元カラーヒストグラムを生成し、更にRGB空間の各座標軸を16分割して小立方体に量子化した後、小立方体に属する画素数を周囲の重み付けにより算出し、最大画素数の小立方体に属する色彩を最大頻度色の文字色として抽出する。
最終的に図22に示すように、テロップ文字候補画像128から最大頻度色の小立方体に属する色を持つパターンを文字部分として抽出することで、最大頻度色に属さない色のパターンをノイズ127として除去し、ノイズを含まない高精度の英文テロップ文字画像(2値画像)を抽出することができる。
また本発明は、コンピュータで実行されるテロップ文字抽出プログラムを格納した記録媒体を提供する。ここで記録媒体とは、CD−ROM、フロッピィディスク(R)、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、回線を介してプログラムを保持するデータベースあるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。
なお、上記の実施形態は、テレビ映像などの静止画であるフレーム画像に含まれるテロップ文字を抽出する場合を例に取るものであったが、本発明はこれに限定されず、適宜の静止画の背景上に存在する文字の抽出につき、そのまま適用することができる。
また上記の実施形態における輝度クラス生成のための閾値の導出として、クラス分離を最大とすることのできる大津の方法により閾値を導出しているが、予め固定的に設定した閾値によるクラス分けを行ってもよい。また上記の実施形態にあっては、多値クラス化として2クラス化と3クラス化を例にとっているが、それ以上のクラス化を行うようにしてもよいことは勿論である。
また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態に示した数値による限定は受けない。

ここで本発明の特徴をまとめて列挙すると次の付記のようになる。
(付記)

(付記1)(プログラム)
コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラム。(1)
(付記2)(エッジ領域抽出の詳細)
付記1記載のテロップ文字抽出プログラムに於いて、前記エッジ領域抽出部は、
前記グレースケール画像からエッジを抽出したエッジ画像を生成し、
前記エッジ画像を2値化してエッジ2値画像を生成し、
前記エッジ2値画像のエッジ画素を膨張させて前記エッジ領域画像を生成することを特徴とするテロップ文字抽出プログラム。
(付記3)(輝度ヒストグラム生成の詳細)
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度ヒストグラム作成部は、前記輝度ヒストグラムを作成した後に、各輝度のヒストグラム値として、隣接する複数の輝度のヒストグラム値との移動平均値を算出して平滑化することを特徴とするテロップ文字抽出プログラム。
(付記4)(輝度クラス生成の詳細:一般系)
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
前記輝度ヒストグラムの輝度軸上に1又は複数の閾値を設定して分割した輝度クラスもつ複数種類の輝度ヒストグラムを生成し、
前記複数種類の輝度ヒストグラムについて、前記閾値上のヒストグラム値の平均値を比較し、平均値が最小となる輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。
(付記5)(輝度クラス生成の詳細:2値化/3値化)
付記1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラムを生成し、
輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。(2)
(付記6)(テロップ文字候補の詳細:背景ノイズ除去)
付記1記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。(3)
(付記7)(テロップ文字候補の詳細:線密度による選択)
付記6記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、前記クラス毎に求めた2値画像の面積に大きな差がない場合、各クラスの2値ラベル画像毎に線密度を算出し、前記線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。
(付記8)(テロップ文字候補の詳細:線密度の定義)
付記7記載のテロップ文字抽出プログラムに於いて、前記線密度は、前記2値画像の行毎に背景画素から文字画素への変化点の数を求めた総和を、前記2値画像の行数で割った値であることを特徴とするテロップ文字抽出プログラム。
(付記9)(ノイズ除去の詳細:処理方法1)
付記1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ字領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
前記最大頻度色の抽出は、
前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出プログラム。(4)
(付記10)(ノイズ除去の詳細:処理方法2)
付記1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズと判定して前記テロップ文字候補画像から除去したテロップ文字画像を生成することを特徴とするテロップ文字抽出プログラム。(5)
(付記11)(記録媒体)
コンピュータに、
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を実行させるためのテロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体。(6)
(付記12)(方法)
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
前記輝度ヒストグラムの輝度を輝度クラスに分割する輝度クラス生成ステップと、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去ステップと、
を備えたことを特徴とするテロップ文字抽出方法。(7)
(付記13)(エッジ領域抽出の詳細)
付記12記載のテロップ文字抽出方法に於いて、前記エッジ領域抽出ステップは、
前記グレースケール画像からエッジを抽出したエッジ画像を生成し、
前記エッジ画像を2値化してエッジ2値画像を生成し、
前記エッジ2値画像のエッジ画素を膨張させて前記エッジ領域画像を生成することを特徴とするテロップ文字抽出方法。
(付記14)(輝度ヒストグラム生成の詳細)
付記12記載のテロップ文字抽出方法に於いて、前記輝度ヒストグラム作成ステップは、
前記輝度ヒストグラムを作成した後に、各輝度のヒストグラム値として、隣接する複数の輝度のヒストグラム値との平均値を算出して平滑化することを特徴とするテロップ文字抽出方法。
(付記15)(輝度クラス生成の詳細:2値化/3値化)
付記12記載のテロップ文字抽出方法に於いて、前記輝度クラス生成ステップは、
前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラム生成し、
輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出方法。
(付記16)(テロップ文字候補の詳細:背景ノイズ除去)
付記12記載のテロップ文字抽出方法に於いて、前記文字パターン候補選択ステップは、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出方法。
(付記17)(テロップ文字候補の詳細:線密度による選択)
付記12記載のテロップ文字抽出方法に於いて、前記文字パターン候補選択ステップは、前記クラス毎に求めた2値画像の面積に大きな差がない場合、各クラスの2値画像毎に線密度を算出し、前記線密度が最小となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出方法。
(付記18)(ノイズ除去の詳細:処理方法1)
付記12記載のテロップ文字抽出方法に於いて、前記ノイズ除去ステップは、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
前記最大頻度色の抽出は、
前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出方法。
(付記19)(ノイズ除去の詳細:処理方法2)
付記1記載のテロップ文字抽出方法に於いて、前記ノイズ除去ステップは、
前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズとして前記テロップ文字候補画像から除去してテロップ文字画像を生成することを特徴とするテロップ文字抽出方法。
(付記20)(装置)
カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することによりノイズ画素を除去してテロップ文字画像を生成するノイズ除去部と、
を備えたことを特徴とするテロップ文字抽出装置。(8)
本実施形態のテロップ文字抽出装置における機能構成を示したブロック図 本実施形態のプログラムが実行されるコンピュータのハードウェア環境を示したブロック図 本実施形態によるテロップ文字抽出処理の手順を示したフローチャート 図3のステップS3におけるエッジ近傍領域抽出処理の詳細を示したフローチャート 本実施形態におけるテロップ領域画像、グレースケール画像、エッジ2値画像及び膨張画像を示した説明図 図3のステップS4におけるヒストグラム作成処理の詳細を示したフローチャート ヒストグラムの平滑化処理を示した説明図 平滑化するための移動平均計算の説明図 図3のステップS5における輝度クラス生成処理の詳細を示したフローチャート 本実施形態における2クラス化と3クラス化した輝度ヒストグラムの説明図 図3のステップS6における文字パターン候補選択処理の詳細を示したフローチャート 図11のステップS11における3クラス化候補抽出処理の詳細を示したフローチャート 本実施形態の3クラス化候補抽出処理における処理画像を示した説明図 図13の低輝度クラスにおける処理画像を拡大して示した説明図 図3のステップS7におけるノイズ除去処理の詳細を示したフローチャート 図15のステップS1における文字色画像生成の処理画像を示した説明図 図15のノイズ除去による処理画像を示した説明図 図3のステップS7におけるノイズ除去処理の詳細の他の実施形態を示したフローチャート 英文テロップ文字を対象とした本実施形態におけるテロップ領域画像、グレースケール画像、エッジ2値画像及び膨張画像を示した説明図 英文テロップ文字を対象とした本実施形態の3クラス化候補抽出処理における処理画像を示した説明図 英文テロップ文字を対象とした図15のステップS1における文字色画像生成の処理画像を示した説明図 英文テロップ文字を対象とした図15のノイズ除去による処理画像を示した説明図
符号の説明
10:テロップ文字抽出処理部
12:映像ファイル
14:記憶部
16:画像入力部
18:グレースケール画像生成部
20:エッジ領域抽出部
22:輝度ヒストグラム作成部
24:輝度クラス生成部
26:文字パターン候補選択部
28:ノイズ除去部
30:テロップ文字出力部
32:テロップ領域画像
34:グレースケール画像
36:エッジ領域画像
38:輝度ヒストグラム
40:輝度クラス別2値画像
42:テロップ文字候補画像
44:テロップ文字画像
46:文字認識部
48:CPU
50:バス
52:RAM
54:ROM
56:ハードディスクドライブ
58:デバイスインタフェース
60:キーボード
62:マウス
64:ディスプレイ
66:ネットワークアダプタ
68,108:テロップ領域画像
70,110:グレースケール画像
72,112:エッジ2値画像
74,114:膨張画像
76,78:輝度ヒストグラム曲線
80:平滑化前輝度値
82:平滑化後輝度値
84−1,86−1:低輝度クラス
84−2,86−3:高輝度クラス
86−2:中輝度クラス
90−1〜90−3,116−1〜116−3:2値画像
92−1〜92−3,118−1〜118−3:2値ラベル画像
94−1〜94−3,120−1〜120−3:ノイズ除去2値画像
96−1〜96−8:文字パターン
98−1,98−2,98−8:ラベルパターン
100,122:原画増
102,124:論理積
104,126:文字色画像
105,127:ノイズ
106,128:テロップ文字画像

Claims (8)

  1. コンピュータに、
    カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
    前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
    前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
    前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
    前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
    前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
    前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
    を実行させるためのテロップ文字抽出プログラム。
  2. 請求項1記載のテロップ文字抽出プログラムに於いて、前記輝度クラス生成部は、
    前記輝度ヒストグラムの輝度軸上に単一の閾値を設定して2分割した輝度クラスをもつ第1輝度ヒストグラムと、前記輝度ヒストグラムの輝度軸上に2つの閾値を設定して3分割した輝度クラスをもつ第2輝度ヒストグラムを生成し、
    輝度クラスを2分割した前記第1輝度ヒストグラムの閾値上のヒストグラム値と、輝度クラスを3分割した前記第2輝度ヒストグラムの2つの閾値上のヒストグラム値の平均値とを比較し、小さい方の輝度ヒストグラムを選択することを特徴とするテロップ文字抽出プログラム。
  3. 請求項1記載のテロップ文字抽出プログラムに於いて、前記文字パターン候補選択部は、
    前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成すると共に、連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
    前記2値ラベル画像に含まれる文字パターンの中から前記テロップ領域画像の外周に接している前記文字パターンのラベル番号を検出し、検出したラベル番号を持つ文字画素を背景ノイズとして除去し、
    背景ノイズを削除した2値画像の面積をクラス毎に求め、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択することを特徴とするテロップ文字抽出プログラム。
  4. 請求項1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
    前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成して最大頻度色を抽出し、
    前記テロップ文字候補画像から前記最大頻度色に対応する文字画素を抽出してノイズ画素を除去することによりテロップ文字画像を生成し、
    前記最大頻度色の抽出は、
    前記文字色画像についてRGBカラー空間の3次元カラーヒストグラムを生成し、
    前記RGBカラー空間の各座標軸をn分割して量子化した小立方体を作成し、各小立方体に含まれる前記文字色画像の画素数をカウントし、
    各小立方体毎に、周囲に存在する複数の小立方体と比較してカウントが同じか大きい場合に、周囲にある小立方体のカウントを全て合計した値を自己のカウントとし、
    前記カウントが最大となる小立方体に属する色を最大頻度色として抽出することを特徴とするテロップ文字抽出プログラム。
  5. 請求項1記載のテロップ文字抽出プログラムに於いて、前記ノイズ除去部は、
    前記テロップ文字画像と原画である前記テロップ領域画像との論理積をとって文字色画像を生成し、
    前記輝度クラス毎に各クラスに属する輝度の画素を集めた2値画像を生成すると共に連続する画素に同じラベル番号を付与して文字パターンとした2値ラベル画像を生成し、
    前記文字色画像から全体平均色を求めると共に、前記2値ラベル画像の同一ラベル番号を付与した画素集合からなる文字パターン毎に領域平均色と領域面積を求め、
    ノイズ判定値として、前記2値ラベル画像の文字パターン毎に、全体平均色と領域平均色との差に領域面積を乗算した値を算出し、
    前記ノイズ判定値が所定の閾値より大きな文字パターンをノイズと判定して前記テロップ文字候補画像から除去したテロップ文字画像を生成することを特徴とするテロップ文字抽出プログラム。
  6. コンピュータに、
    カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
    前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
    前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
    前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
    前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
    前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
    前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
    を実行させるためのテロップ文字抽出プログラムを格納したコンピュータ可読の記録媒体。
  7. カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力ステップと、
    前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成ステップと、
    前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出ステップと、
    前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成ステップと、
    前記輝度ヒストグラムの輝度を輝度クラスに分割する輝度クラス生成ステップと、
    前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択ステップと、
    前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去ステップと、
    を備えたことを特徴とするテロップ文字抽出方法。
  8. カラー画像データから切り出されたテロップ文字を含むテロップ領域画像を入力する画像入力部と、
    前記テロップ領域画像からグレースケール画像を生成するグレースケール画像生成部と、
    前記グレースケール画像からエッジを抽出して膨張させたエッジ領域画像を生成するエッジ領域抽出部と、
    前記エッジ領域画像をマスク画像として前記グレースケール画像のマスク画像に属する画素の輝度ヒストグラムを作成するヒストグラム作成部と、
    前記輝度ヒストグラムの輝度を複数の輝度クラスに分割する輝度クラス生成部と、
    前記輝度クラス毎に、各クラスに属する輝度の画素を集めた2値画像を生成し、面積が最大となるクラスの2値画像をテロップ文字候補画像として選択する文字パターン候補選択部と、
    前記テロップ文字候補画像に対応して前記テロップ領域画像で使われている文字色を判定し、前記文字色に該当する文字画素を前記テロップ文字候補画像から抽出することにより判定した文字色以外の文字画像をノイズ画素として除去してテロップ文字画像を生成するノイズ除去部と、
    を備えたことを特徴とするテロップ文字抽出装置。
JP2007025259A 2007-02-05 2007-02-05 テロップ文字抽出プログラム、記録媒体、方法及び装置 Active JP4861845B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007025259A JP4861845B2 (ja) 2007-02-05 2007-02-05 テロップ文字抽出プログラム、記録媒体、方法及び装置
US12/021,611 US7961948B2 (en) 2007-02-05 2008-01-29 Computer-readable record medium in which a telop character extraction program is recorded, telop character extraction method and telop character extraction apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007025259A JP4861845B2 (ja) 2007-02-05 2007-02-05 テロップ文字抽出プログラム、記録媒体、方法及び装置

Publications (2)

Publication Number Publication Date
JP2008191906A JP2008191906A (ja) 2008-08-21
JP4861845B2 true JP4861845B2 (ja) 2012-01-25

Family

ID=39676227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007025259A Active JP4861845B2 (ja) 2007-02-05 2007-02-05 テロップ文字抽出プログラム、記録媒体、方法及び装置

Country Status (2)

Country Link
US (1) US7961948B2 (ja)
JP (1) JP4861845B2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4667381B2 (ja) * 2004-07-20 2011-04-13 パナソニック株式会社 映像処理装置およびその方法
EP2064658A4 (en) * 2006-09-07 2017-08-23 Lumex As Relative threshold and use of edges in optical character recognition process
US20080174607A1 (en) * 2007-01-24 2008-07-24 Ali Iranli Systems and methods for reducing power consumption in a device through a content adaptive display
JP4861845B2 (ja) * 2007-02-05 2012-01-25 富士通株式会社 テロップ文字抽出プログラム、記録媒体、方法及び装置
JP5090330B2 (ja) * 2008-12-26 2012-12-05 Kddi株式会社 画像処理装置、画像処理方法およびプログラム
JP2010245853A (ja) * 2009-04-07 2010-10-28 Hitachi Ltd 動画インデクシング方法及び動画再生装置
JP5377649B2 (ja) * 2009-09-02 2013-12-25 ルネサスエレクトロニクス株式会社 画像処理装置および映像再生装置
CN102511048B (zh) * 2009-12-31 2015-08-26 塔塔咨询服务有限公司 一种用于预处理包括文本的视频区域的方法及系统
JP2012003480A (ja) * 2010-06-16 2012-01-05 Nippon Hoso Kyokai <Nhk> テロップ文字領域検出装置、及びプログラム
JP5500480B2 (ja) * 2010-06-24 2014-05-21 株式会社日立情報通信エンジニアリング 帳票認識装置及び帳票認識方法
CN103034854B (zh) * 2011-09-30 2016-03-30 富士通株式会社 图像处理装置和方法
US8818030B2 (en) * 2011-12-13 2014-08-26 Xerox Corporation Post-processing a multi-spectral image for enhanced object identification
US8831381B2 (en) * 2012-01-26 2014-09-09 Qualcomm Incorporated Detecting and correcting skew in regions of text in natural images
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
JP5964078B2 (ja) * 2012-02-28 2016-08-03 学校法人東京電機大学 文字認識装置、文字認識方法およびプログラム
JP5547226B2 (ja) * 2012-03-16 2014-07-09 株式会社東芝 画像処理装置、及び画像処理方法
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
US9183458B2 (en) 2012-07-19 2015-11-10 Qualcomm Incorporated Parameter selection and coarse localization of interest regions for MSER processing
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
JP6092024B2 (ja) * 2013-07-03 2017-03-08 日本電信電話株式会社 文字認識装置、方法、及びプログラム
CN104766076B (zh) * 2015-02-28 2019-01-01 北京奇艺世纪科技有限公司 一种视频图像文字的检测方法和装置
JP2018534703A (ja) * 2015-09-10 2018-11-22 エスワイエヌシー−アールエックス、リミテッド 自動画像特徴除去
CN105913065B (zh) * 2016-04-12 2019-06-11 中国科学院遥感与数字地球研究所 一种图像目标区域提取的方法及系统
CN108961260B (zh) * 2017-05-26 2021-08-24 创新先进技术有限公司 图像二值化方法及装置、计算机存储介质
WO2019026392A1 (ja) * 2017-07-31 2019-02-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN108847252B (zh) * 2018-04-26 2022-12-02 杭州电子科技大学 基于声信号语谱图纹理分布的声特征提取方法
CN110717922A (zh) * 2018-07-11 2020-01-21 普天信息技术有限公司 一种图像清晰度评价方法及装置
KR102573562B1 (ko) * 2019-02-19 2023-09-04 삼성전자주식회사 디텐트 구조물이 배치된 힌지 모듈 및 이를 포함하는 접이식 전자 장치
EP3894984B1 (en) * 2019-02-19 2023-06-28 Samsung Electronics Co., Ltd. Hinge module including detent structure and foldable electronic device including the hinge module

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3230368B2 (ja) * 1994-02-28 2001-11-19 新日鉄ソリューションズ株式会社 二値化処理方法
US6226402B1 (en) * 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
FI104521B (fi) * 1997-01-30 2000-02-15 Nokia Multimedia Network Termi Menetelmä kuvasekvenssien kontrastin parantamiseksi
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
JP3655110B2 (ja) * 1998-12-15 2005-06-02 株式会社東芝 映像処理方法及び装置並びに映像処理手順を記録した記録媒体
JP3692018B2 (ja) * 2000-01-24 2005-09-07 株式会社東芝 テロップ情報処理装置
JP2004252748A (ja) * 2003-02-20 2004-09-09 Toshiba Corp 画像処理方法、画像処理装置
JP4048996B2 (ja) * 2003-04-11 2008-02-20 ソニー株式会社 テロップの抽出装置および抽出方法、並びにプログラムおよび媒体
JP2004364234A (ja) * 2003-05-15 2004-12-24 Pioneer Electronic Corp 放送番組内容メニュー作成装置及び方法
JP4861845B2 (ja) * 2007-02-05 2012-01-25 富士通株式会社 テロップ文字抽出プログラム、記録媒体、方法及び装置

Also Published As

Publication number Publication date
US20080187225A1 (en) 2008-08-07
US7961948B2 (en) 2011-06-14
JP2008191906A (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
JP4861845B2 (ja) テロップ文字抽出プログラム、記録媒体、方法及び装置
US11922615B2 (en) Information processing device, information processing method, and storage medium
CN110678901B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
KR20010110416A (ko) 비디오 스트림 분류가능 심볼 고립 방법 및 시스템
JP2005339547A (ja) 画像の文字抽出装置、画像の文字抽出方法及びこの画像の文字抽出方法を実現するためのコンピュータ可読コードを記録した媒体
JP5786495B2 (ja) 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム
JP2007174654A (ja) 文書画像を示す走査データを処理するための方法
CN108805116A (zh) 图像文本检测方法及其系统
Shi et al. Adaptive graph cut based binarization of video text images
JP4926266B2 (ja) 学習データ作成装置、学習データ作成方法及びプログラム
JP2007048006A (ja) 画像処理装置および画像処理プログラム
JP4164489B2 (ja) 文書画像強調方法、装置及びそのための記憶媒体
US9064179B2 (en) Region extraction apparatus, region extraction method, and computer program product
Zhang et al. A novel approach for binarization of overlay text
CN116977931A (zh) 一种基于深度学习的高空抛物识别方法
Felhi et al. Multiscale stroke-based page segmentation approach
Huang A novel video text extraction approach based on Log-Gabor filters
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
Manisha et al. Text frame classification and recognition using segmentation technique
JP4943501B2 (ja) 画像処理装置及び方法、並びに、光学式の文字識別装置及び方法
KR100499121B1 (ko) 자동 문턱치화 기술을 이용한 영상분할 장치 및 그 방법
Awoke et al. Ethiopic and latin multilingual text detection from images using hybrid techniques
Tribuzy et al. Vehicle License Plate Preprocessing Techniques Using Graphical Interface
CN108573258B (zh) 一种快速的复杂背景图像中维语文字定位方法
JP2005083843A (ja) 欠陥検出装置、クラスタ生成装置、欠陥分類装置、欠陥検出方法、クラスタ生成方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091016

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111107

R150 Certificate of patent or registration of utility model

Ref document number: 4861845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3