JP4158449B2 - 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム - Google Patents
画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム Download PDFInfo
- Publication number
- JP4158449B2 JP4158449B2 JP2002230379A JP2002230379A JP4158449B2 JP 4158449 B2 JP4158449 B2 JP 4158449B2 JP 2002230379 A JP2002230379 A JP 2002230379A JP 2002230379 A JP2002230379 A JP 2002230379A JP 4158449 B2 JP4158449 B2 JP 4158449B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- display
- candidate
- hierarchy
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、例えばテレビジョン放映された映像から、所定の画像の少なくとも一部を抽出して表示する画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システムに関し、特に、番組等の見出しとなるような文字情報を含む所定の画像を表示する画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システムに関する。
【0002】
【従来の技術】
通常、TV番組には、番組のタイトル、番組を構成する各コーナのタイトル、及び番組又は各コーナに含まれる所定のシーンに対するキャプション等のように、その後に続く夫々番組、コーナ及びシーンの内容を表す文字情報を含む映像が含まれている。本明細書においては、このような文字情報を見出しという。
【0003】
図21(a)乃至(d)は、見出しとなる文字情報を含む画像の例を示す模式図である。例えば、図21(a)に示す見出し画像は、番組名(番組タイトル)が画面の中央位置に表示されている例である。また、図21(b)に示す見出し画像は、ボクシングの試合を放映する番組内において、4ラウンド目が始まることを示す「ROUND4」というテロップが画面中央位置に表示されている例である。
【0004】
更に、図21(c)は、例えば司会者が、ゲストに対して視聴者から寄せられた質問を行い、これにゲストが回答していくようなトークショウを放映するような番組等において、例えば、視聴者からゲストに対してよせられた「好きな言葉は何ですか」という質問が表示されている例であり、トーク番組においてはこのような質問毎に番組が区切られている場合がある。更にまた、図21(d)は、テロップリストを示す例であり、例えばニュース番組等において、最初に番組内で取り扱うニュースの要約をテロップとしてリスト表示される場合がある。
【0005】
ところで、このような見出し情報が、例えは番組タイトルを示す場合は、その番組放映期間内、また、番組を構成するあるコーナタイトルを示す場合は、そのコーナの放映期間内に得られれば、視聴者は今どの番組でどのコーナが放送されているか等を知ることができ便利である。
【0006】
図22に示すように、番組A、番組Bが順に放映される場合、通常、番組Aが始まる時点Taで番組Aのタイトルが表示され、その後、番組Aに設けられたコーナA1が始まる時点TbでコーナA1のコーナタイトルが表示される。同様に、番組B、番組Bに設けられたコーナB1、B2が始まる時点Tc、Td、Teにおいて、夫々番組Bの番組タイトル、コーナB1のコーナタイトル、コーナB2のコーナタイトルが表示されるものとする。このとき、この番組Aの番組タイトルの有効期間、即ち、番組Aの放映時間は、時刻Ta〜Tcであり、コーナA1の有効期間、即ち、コーナA1の放映時間は、Tb〜Tcである。
【0007】
例えば、時刻Tの時点で、視聴者が視聴を開始した場合等、視聴者は、番組タイトル、コーナタイトル等を表示した見出し画像が表示されていないため、現在の番組及びコーナが不明である。そこで、この時刻Tにおいて、番組Bの番組タイトル及びコーナB1のコーナタイトルが表示されていれば、視聴者は、直ちに番組の内容を理解することができ極めて便利である。
【0008】
【発明が解決しようとする課題】
しかしながら、見出しとなる文字情報を含む映像は、ごく短い時間だけ放送されるものであり、従って、視聴者は、番組の任意の時点でこの見出しを含む映像を得ることはできない。従って、たとえ見出しとなる画像を抽出して表示したとしても、その画像が現在見ている時点でも有効かどうか、即ち、ある番組タイトルの見出しを表示していたとしても、その番組が現在放映中であるかどうかを判定することは難しい。
【0009】
例えば、現在見ている映像に対して有効でない見出しを表示してしまうことがある。即ち、図23に示すように、番組Bに含まれるコーナB1が時刻Td〜Teに放映され、コーナB2が時刻Te〜に放映されるものであるとき、時刻T>Teにおいて、即ち、コーナB2の放映が開始されているのにも拘わらず、コーナB1のタイトルを示す見出しを含む画像を表示しても、コーナB1は既に終了しているため、視聴者にとって意味がないものとなってしまう。
【0010】
本発明は、このような従来の実情に鑑みて提案されたものであり、TV映像の中から見出しとなるような文字情報を含む画像を抽出し、抽出した画像の中で現時点において有効である画像のみを抽出して表示することができる画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システムを提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る画像表示装置は、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示装置において、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、上記表示候補画像の特徴を抽出する特徴抽出手段と、上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルと、上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定手段と、1以上の表示手段に接続され、上記表示画像判定手段により表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示するよう制御する表示制御手段とを有する。
【0012】
本発明においては、映像から表示候補画像を抽出し、更にその特徴を抽出し、階層テーブルを参照して各階層の特徴と、表示候補画像の特徴の類似度から表示候補画像の階層を決定し、この階層に基づき表示候補画像を表示するか否かを判定するため、例えば常に階層が高い画像を表示することができ、見出しを含む画像の有効期間に対応するように階層のレベルを設定しておけば、階層レベルから画像の有効期間を推定して常に有効な見出しを含む画像を表示することが可能となる。
【0013】
また、上記分類手段は、上記表示候補画像の特徴と、上記階層テーブルの各階層の特徴との類似度を比較し、該類似度が所定の閾値以上となる階層のうち最も類似度が大きい階層に上記表示候補画像を分類することができ、所定の類似度に達しない表示候補画像はいずれの階層にも分類しないことにより、誤検出を低減する。
【0014】
更に、上記表示画像判定手段により表示すると判定された表示用画像又は該表示用画像から切り出した文字領域を上記階層毎に記憶する画像記憶手段を有することができる。
【0015】
更にまた、上記表示画像判定手段は、上記表示候補画像の階層のレベルが、上記画像記憶手段に記憶されている過去に抽出された表示用画像の階層のレベル以上である場合、該表示候補画像を表示すると判定することができる。
【0016】
また、上記表示画像判定手段により表示すると判定された表示用画像の階層レベルが、上記画像記憶手段に記憶されている過去に抽出された表示用画像の階層レベルと同一である場合、過去に抽出された表示用画像を新たに判定された表示用画像に書き換える更新手段を有することができ、常に階層レベルが高いものを記憶することができる。
【0017】
更に、上記更新手段は、上記新たに判定された表示用画像の階層のレベルが、上記過去に抽出された表示用画像の階層のレベル以上である場合、上記過去に抽出された表示用画像を消去することができる。
【0018】
更にまた、上記特徴抽出手段は、上記表示候補画像に含まれる文字の特徴を抽出する文字特徴抽出手段、上記表示候補画像が人工画像であるか否かを検出する人工画像検出手段、上記表示候補画像の中央位置に人物が存在するか否かを検出するバストショット検出手段、上記表示候補画像にアニメーションがあるか否かを検出するアニメーション検出手段、及び上記表示候補画像の入力時刻を検出する時刻検出手段のうち少なくとも1つを有することができる。
【0020】
本発明に係る画像表示方法は、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示方法において、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出工程と、上記表示候補画像の特徴を抽出する特徴抽出工程と、上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルを使用し、該階層テーブルに記憶された各階層の特徴と上記特徴抽出工程にて抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類工程と、分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定工程と、上記表示画像判定工程にて表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を1以上の表示手段にて表示するよう制御する表示制御工程とを有する。
【0021】
本発明に係るプログラム及びこれが記録されたコンピュータ読み取り可能な記録媒体は、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する動作をコンピュータに実行させるためのプログラム及びこれが記録された記録媒体において、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出工程と、上記表示候補画像の特徴を抽出する特徴抽出工程と、上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルを使用し、該階層テーブルに記憶された各階層の特徴と上記特徴抽出工程にて抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類工程と、分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定工程と、上記表示画像判定工程にて表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を1以上の表示手段にて表示するよう制御する表示制御工程とを有する。
【0022】
本発明に係る画像表示システムは、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示システムにおいて、1以上の表示装置と、上記表示装置に上記所定の画像の少なくとも一部を供給する画像表示装置とを有し、上記画像表示装置は、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、上記表示候補画像の特徴を抽出する特徴抽出手段と、上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルと、上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定手段と、1以上の表示手段に接続され、上記表示画像判定手段により表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示するよう制御する表示制御手段とを具備する。
【0023】
本発明においては、複数台の表示装置を使用すれば、例えば1つの表示装置に映像をそのまま表示し、この映像と同時に、他の表示装置に映像から抽出されその階層が分類された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示することができる。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態について説明する。本実施の形態に係る画像表示装置は、テレビジョン放映された映像から文字情報を含む表示候補画像を抽出し、特徴検出手段により検出された表示候補画像の特徴に基づいてこの表示候補画像を複数の階層のうちいずれかの階層に分類することにより、分類された階層のレベルから、現時点において、画像に含まれる見出しが有効であるか否かを推定することができる。以下、階層のレベルから、見出しが有効である否かを推定することができる本実施の形態における動作原理について簡単に説明する。以下、見出しを含む画像を見出し画像という。
【0025】
上述したように、テレビジョン放映された映像等には、図21に示すような番組又は番組を構成する各コーナの区切りとなるような文字情報である見出しが含まれる。そこで、本実施の形態に係る画像表示装置は、最初にTV映像からこのような見出しとなり得る文字情報を含む画像を表示候補画像として抽出し、この候補画像の階層レベルを求めることにより、見出しの有効期間を推定する。見出しの有効期間を推定することができれば、候補となっている画像に含まれる見出しが現在の映像においても有効であるか、又は上記見出しは既に放映済みの番組又はコーナに関するもので、現在の映像においては無効であるかを推定することができる。そして、現在有効である見出し画像のみを、この見出しの有効期間内に表示することができる。
【0026】
ここで、有効期間とは、上述の図22に示したように、例えば、番組タイトルであれば、その番組が放映されている期間であり、コーナタイトルであれば、そのコーナが放映されている期間である。
【0027】
有効期間内の見出しを含む画像を画面に表示するために、本実施の形態においては、番組、コーナ、シーン等の構成に基づいて、即ち見出しの有効期間に基づいて見出し画像の階層を設定する。
【0028】
即ち、TV映像から、例えば番組タイトル又は番組を構成するコーナタイトルを示す文字情報である見出しを有する見出し画像を抽出し、画像の特徴から見出しの階層がどの階層にあるかを推定することにより、抽出した画像群から、その見出しの有効期間の長さを推定し、現在の時点で有効期間内であると推定される画像のみを表示することができる。
【0029】
次に、本実施の形態において、見出し画像に設定される階層について詳細に説明する。図1(a)及び(b)は、本実施の形態の夫々階層の順位(レベル)及び見出しの有効期間を説明する図である。テレビジョン放映される映像は、一般に、複数の番組から構成され、各番組は複数のコーナから構成されている場合が多い。そして、図1(b)に示すように、番組Aは、コーナA11,A12を有し、コーナA11はシーンA2を有しているとき、番組A、コーナA11,A12、シーンA2の見出しは、上述したようにその有効期間が存在する。そして、例えば、番組Aの有効期間T1、コーナA11の有効期間T2、シーンA2の有効期間T3には、T1>T2>T3の関係がある。このような番組の構成に基づいて、図1(a)に示すように、見出しの階層のレベルを設定するものとする。
【0030】
テレビジョン放映された映像は、番組等の上位の階層の有効期間(放映時間)と、各コーナ又はシーン等の下位の階層の放映時間とに包含関係がある、即ち、下位の階層の放映時間は上位の階層の放映時間に含まれるため、階層レベルを求めることにより、常に放映時間中の見出し画像を抽出することができるのである。
【0031】
例えば、番組の見出しとなる文字情報として番組タイトルが挙げられるが、番組タイトルは、図1(b)に示すように、その番組において最も階層が高いものとし、有効期間T1が最も長い。一方、番組に包含される各コーナの見出しは、番組タイトルよりも階層が低いものとし、番組タイトルよりも有効期間T2が短い。更に、各コーナに包含されるシーンは、コーナの階層より更に下の階層に分類され、その見出しは、コーナの有効期間T2よりも更に有効期間T3が短い。
【0032】
階層が同様な見出し画像は、同様な特徴を有することから、番組の構成に基づいて複数の階層を設定することにより、このような見出し画像の階層を求めれば、その包含関係を推定する、即ち、見出しの有効期間を推定することができる。
【0033】
ここで、階層が高い見出しを含む見出し画像の傾向として次のような特徴がある。
1.文字が中央に位置している
2.文字が大きい
3.背景が人工画像である
4.出現時に派手なアニメーションがある
5.出現時の時刻の分が5の倍数近傍である(特に、00分、55分、30分)
6.出現時の時刻の秒が00秒の近傍である
7.キャスターが存在してテロップに装飾がある(図4参照)
8.テロップがリスト表示されている(図5参照)
上述したように、同じ階層を有する見出し画像同士は、似たような特徴を有するという傾向があり、見出し画像の上記8つの特徴を検出すれば、似たような特徴を有する見出し画像毎に、大まかな階層を決定することができる。本実施の形態における画像表示装置は、このようにして画像の特徴から各見出し画像の階層を求めることにより、現時点においてどの見出し画像が有効期間内(有効である)か、又は有効期間を過ぎている(有効でない)かを推定することができる。即ち、新しく抽出された現時点での画像の階層が、過去に抽出された画像の階層と同一又はこれより高ければ、このような過去の見出し画像は現時点において有効でなく、逆に過去に抽出した画像の階層の方が現時点での画像の階層よりも高ければ、このような過去の見出し画像は依然として有効であると推定することができ、このような推定により、現在有効である見出し画像のみを表示することができるものである。
【0034】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、TV映像から見出しとなる文字情報を含む画像を候補画像として抽出し、抽出した画像の特徴から有効な見出し画像を抽出して複数の表示装置に供給して表示する画像表示システムに適用したものである。このシステムでは、表示装置の数が多いほど有効である見出しを含む画像を多く表示することができる。
【0035】
図2は、本発明の実施の形態に係る画像表示システムを示すブロック図である。図2に示すように、本実施の形態における画像表示システム1は、有効な見出し画像を抽出する画像表示装置10と、入力画像をそのまま表示する例えばテレビジョン受像機等の表示装置70と、画像表示装置10により抽出された有効な見出し画像を表示するための複数の表示装置801〜80Nとから構成されている。
【0036】
画像表示装置10は、入力画像から文字情報を含む画像が表示候補画像として供給されこの候補画像の特徴(特徴量)を抽出する特徴抽出部20と、階層毎に文字情報を含む画像の特徴が記憶されたレベル判定テーブル(階層テーブル)(図示せず)を有し、このレベル判定テーブルを参照して特徴抽出部20により抽出された候補画像の特徴及び端子31を介して入力されるその候補画像の入力時刻(放映開始時刻)とから、候補画像の階層レベルを求めるレベル判定部(分類手段)30と、過去に抽出された見出し画像(表示用画像)が記録されたメモリ60と、レベル判定部30により求められた階層のレベルに基づいてメモリ60に記録されている見出し画像を更新するか否かを判定する更新判定部40と、更新判定部40により更新された画像を複数の表示装置801〜80Nのうち所定の表示装置に供給して表示するよう制御する表示装置制御部50とから構成されている。
【0037】
ここで、図2においては、表示装置801〜80Nに対応する複数の特徴量抽出部20、レベル判定部30、更新判定部40、及びメモリ60が設けられている例を示すが、全ての表示装置801〜80Nに共通に設けるものとしてもよい。
【0038】
特徴抽出部20は、入力画像から文字情報を含む画像として抽出された表示候補画像が供給される。このような表示画像候補は、公知の文字情報の検出方法等を使用して行うことができる。また、特徴抽出部20の前段に、後述する文字情報検出装置(図示せず)設け、これにより文字情報が検出された画像を表示画像候補として特徴抽出部20に供給することができる。この文字情報検出装置では、文字情報は、それを構成する画素が高輝度である、エッジ密度が高い、特徴的な出現・消失形態をとる、出現した後一定時間の安定状態を有する、自然界に無い色が使用されている、及び文字情報の内容と出現場所とに関係がある等の特徴を有することを利用して文字情報を検出するものである。
【0039】
そして、特徴抽出部20は、表示候補画像から上述した特徴、即ち、文字情報(テロップ)の画面における出現位置、文字情報の大きさ、背景が人工画像であるか又は自然画像であるか、出現時に派手なアニメーションがあるか否か、出現時の時刻、キャスターが存在してテロップに装飾があるか否か、及びテロップがリスト表示されているか否か、等の特徴(特徴量)を抽出する。
【0040】
なお、本実施の形態においては、先ず、入力画像から、文字情報を含む画像を表示候補画像として抽出し、この表示候補画像から特徴を抽出するものとしたが、例えば、全ての入力画像から特徴を抽出してもよい。
【0041】
レベル判定部30は、特徴抽出部20で抽出した候補画像の特徴と、端子31を介してその候補画像の放映開始時刻が入力される。そして、この特徴と放映開始時刻とからその候補画像の階層を求め、この階層に基づきその階層の高さに応じてレベル値を決定する。文字情報を含む画像の特徴に応じて複数の階層が予め設定されており、レベル判定部30は、各階層毎の特徴が記録されたレベル判定テーブルを有しており、このレベル判定テーブルを参照して階層毎の特徴と、抽出された候補画像の特徴との類似度から、候補画像がいずれの階層に属するかを分類することができる。
【0042】
表示装置制御部50は、各更新判定部40に対して識別情報(ID番号)を与える。本実施の形態においては、ID番号は、1からNまでの数値を順に付すものとする。
【0043】
更新判定部40は、レベル判定部30から入力された候補画像のレベル値と、表示装置制御部50により与えられた自身のID番号とを比較することにより、メモリ60に保存されている画像を更新するか否かを判定する。更新すると判定された場合にはメモリ60の画像の更新を行う。
【0044】
表示装置70は、入力画像をそのまま表示し、それ以外の各表示装置801〜80Nはメモリ60に保存されている所定の画像の少なくとも一部を表示する。
【0045】
以下、本実施の形態の画像表示装置について更に詳細に説明する。先ず、特徴抽出部20について説明する。図3は、特徴抽出部を示すブロック図である。特徴抽出部20は、図3に示すように、入力画像から文字情報を含む画像として抽出された表示候補画像が供給され、アニメーションを抽出するアニメーション抽出部21、文字情報及び文字の装飾を抽出する文字抽出部22、人工画像であるか否かを抽出する人工画像検出部23、及びアンカーショットが含まれているか否かを検出するアンカーショット検出部(バストショット検出手段)24と、文字抽出部22により抽出された文字情報の大きさ、位置等の特徴を抽出する文字特徴抽出部25、及び人工画像検出部23により人工画像か否かが検出された後、その背景の特徴を抽出する背景特徴抽出部26とから構成されている。
【0046】
アニメーション検出部21は、派手なアニメーション、動きが大きいアニメーションが出現したか否かを検出するものである。アニメーションの出現は、例えば以下の特徴等を利用して検出することができる。即ち、
1.フレーム間差分が所定の閾値以上で且つ一定時間以上続く
2.フレーム間差分の変動が所定の閾値以上で且つ一定時間以上続く
の条件を満たすとき、アニメーションが出現したものと判定することができる。
【0047】
文字抽出部22では、例えば、以下の特徴等を利用して、テロップ等の文字情報を抽出することができる。即ち、
1.現フレーム画像と数フレーム前の画像との輝度の差分が所定の閾値以上の画素の集合がある
2.輝度の平坦部とエッジ部とが存在する
3.エッジの密度が所定の閾値以上である
の条件を満たすとき、これ領域を文字情報を含む領域として抽出することができる。
【0048】
平坦部及びエッジ部の検出は、例えば、隣接又は近傍の画素間の輝度変化が所定の閾値より小さい場合は平坦部とし、所定の閾値より大きい場合はエッジ部とすることができる。
【0049】
また、例えば以下の特徴等を利用して文字情報の装飾を抽出することができる。即ち、
1.現フレーム画像と数フレーム前の画像との輝度の差分が所定の閾値以上の画素の集合である
2.輝度の平坦部とエッジ部とが存在する
3.エッジの密度が閾値以下である
の条件を満たすとき、これを文字情報の修飾として抽出することができる。ここで、文字情報の修飾とは、図4に示すように、視認性を高めるため等に文字情報近傍に付加されている例えば下線等の装飾101、又は文字情報の先頭文字近傍付加されている絵等の装飾102等を示す。
【0050】
文字特徴抽出部25は、文字抽出部22で抽出した文字の大きさ、位置、及び出現時間を求める。これにより、例えば図4に示すように、画面下方に表示されている場合、又は図5に示すように、水平方向に並んだ文字情報が複数表示されている場合(以下、テロップリストという。)等を区別して認識することができる。
【0051】
人工画像検出部23は、例えば以下の特徴等を利用して、表示候補画像が人工画像であるかどうかを判定することができる。即ち、
1.輝度ヒストグラム又は色相ヒストグラムにおいて所定の値近傍の頻度が所定の閾値以上存在する
2.フレーム間差分が閾値以下の状態が一定時間以上続く
の条件を満たすものを人工画像と判定することができる。
【0052】
その他、人工画像は、一般に、静止画像であって、ある少数の色の頻度が有意に多く、彩度が高い/輝度が極端に高い又は低い画素が多く、また、隣接画素と強い相関を有する画素が多い等の特徴を有する。このような特徴を利用し、例えば輝度又は色相のいずれかのヒストグラムにおいて、自然界には存在し得ないような人工的な色であって、且つそのような色の画像が意図的に存在することがわかる程度の量含まれていることを示す適当な閾値を設けて判定してもよい。
【0053】
背景特徴抽出部26は、人工画像と判定された画像が供給され、その背景の特徴を抽出する。具体的には、輝度、及び色相のヒストグラムから頻度順にソートする。
【0054】
アンカーショット検出部24は、例えば以下の特徴等を利用してアンカーショットを検出することができる。即ち、
1.フレーム間差分が所定の閾値以下の状態が一定時間以上続く
2.肌色領域が特定の位置に存在する
3.特定の領域に輝度差分が所定の閾値以上の点が所定の閾値以上ある
の条件を満たすものをアンカーショットであると判定することができる。
【0055】
ここでは、アニメーション抽出部21、文字抽出部22、人工画像検出部23、アンカーショット検出部24、文字特徴抽出部25、及び背景特徴抽出部26は、上述したように、複数の条件から検出・抽出するものとしたが、常に全ての条件を満たす必要はなく、必要に応じて条件の種類及びそれらを判定する閾値は適宜変更するものとする。
【0056】
次に、レベル判定部30について説明する。先ず、レベル判定部30において、参照されるレベル判定テーブルについて説明する。レベル判定部30は、このレベル判定テーブルを参照して、表示候補画像の特徴からその階層のメインレベルを求めるため、文字情報を含む画像の特徴に対応した階層(メインレベル)が予め設定されたレベル判定テーブルを有している。そして、このレベル判定テーブルを参照し、上述した特徴抽出部で抽出された特徴から表示候補画像のレベルを推定するものである。
【0057】
図6は、レベル判定テーブルを示す模式図である。図6のレベル判定テーブルに示すように、画像の特徴に応じて、A〜Gの階層にレベル分けされている。上述したように、本実施の形態においては、表示候補画像の特徴から、文字情報を含む画像の有効期間の長さに対応する大まかな階層(メインレベル)を決定する。ここで、全てのメインレベルの特徴との類似度が低い場合は、いずれの階層にも分類されないものとする。
【0058】
ここでは、文字情報の位置、大きさ、出現期間、及び背景の種類(人工画像であるか否か)等により、階層を図6に示すA〜Gの7つのメインレベルにレベル分けするものとし、その画像の有効期間が長いもの程、階層が高くなるように設定されている。ここで、本実施の形態においては、放映された映像から文字情報を含む画像を抽出し、その文字情報が有効期間内である画像を表示画像として抽出するため、同じ番組内であれば上位の階層ほど有効期間が長くなるような7つの階層を設定しているが、階層(メインレベル)のレベル分けの方法はこれに限らない。例えば、レベル分けする階層の数等は、適宜増減するものとし、更に、入力される映像、又は抽出対象となる画像に応じて適宜レベル判定テーブルを用意してもよい。
【0059】
そして、レベル判定部30では、大まかに決定された同一のメインレベルにおいても、人工画像の背景の類似性、文字の大きさの類似性等により、その文字情報の有効期間を更に正確に推定するため、メインレベルを更に複数の階層(以下、サブレベルという。)に分類する。以下、本実施の形態において推定される階層の構造、即ち、メインレベル及びサブレベルについて説明する。
【0060】
図7は、メインレベル及びサブレベルの関係を説明する図である。図7に示すように、ある番組において、複数のスポーツ毎の情報を放映するスポーツコーナC1が設けられており、そのスポーツコーナC1内には、複数のスポーツのうち、サッカー情報及び野球情報を放映する夫々サッカーコーナC21及び野球コーナC22が設けられており、更にサッカーコーナC21には、サッカー情報のうち特にワールドカップの情報を放映するワールドカップサッカーコーナC3が設けられているとする。
【0061】
ここで、スポーツコーナC1、サッカーコーナC21、野球コーナC22、及びワールドカップサッカーコーナC3は、ある番組のコーナを構成するものとして、図6に示すレベル判定テーブルにおいてメインレベルが同一の階層で、例えばメインレベルEに分類されるものとする。
【0062】
ところで、サッカーコーナC21及び野球コーナC22は、スポーツコーナC1を構成するコーナの一部であるため、その有効期間がスポーツコーナC1より短く、更に、ワールドカップサッカーコーナC3は、サッカーコーナC21を構成するコーナの一部であるため、その有効期間がサッカーコーナC21より短いものとなる。即ち、同一の階層のメインレベルEに分類されたとしても、これらのコーナには、スポーツコーナC1>サッカーコーナC21、野球コーナC22>ワールドカップサッカーコーナC3というような階層のレベルを有しているものとする。このような同一のメインレベルを示す階層に分類された中にも、更に包含関係を有しているような場合、更に細かく階層(サブレベル)を設定できる場合がある。
【0063】
ここで、同じ番組内におけるメインレベルが同一で且つ類似性が特に高いものは、同一メインレベル且つ同一サブレベルとし、メインレベルが同一でも類似性が低いものは、同一メインレベル且つ非同一サブレベルであって、そのサブレベルは、その放映時刻が早い程、有効期間が長い、即ちサブレベルの階層が高くなるという傾向から、同一メインレベルの階層内に複数のサブレベルを設定することができる。即ち、サッカーコーナC21と野球コーナC22のように、同一メインレベル且つ同一サブレベルの場合は、その類似性が高くなり、サッカーコーナC21及びワールドカップサッカーコーナC3のように、同一メインレベル且つ非同一サブレベルの場合は、その類似性が低くなり、且つサブレベルが高いサッカーコーナC21の方が放映される時刻が早くなっていることを利用して、サブレベルを設定することができる。
【0064】
このように、同一の階層(メインレベル)に推定されたものにおいても、その類似性を判定することにより、更に細かく階層(サブレベル)を分類することができ、これにより、更に正確に有効期間内の文字情報を含む画像を表示することが可能となる。レベル判定部30は、このような表示候補画像の階層(メインレベル及びサブレベル)を決定するものである。
【0065】
更新判定部40は、レベル判定部30において決定された各見出し画像の階層を比較することにより、見出し画像を更新するか否かを判定する。これにより、メモリ60に記憶されている見出し画像のうち、有効期間が切れた見出し画像を有効期間内の見出し画像に更新することができる。ここで階層の高さ(メインレベル及びサブレベル)を比較することにより有効期間内の見出し画像を表示することができる原理について説明する。図8は、レベルを比較することで有効期間内の文字情報を含む画像を表示する原理を説明する図である。
【0066】
図8には、ある番組D内にあるコーナD11及びD12が設けられ、更に、あるコーナD11内にあるシーンD2が設けられているような場合を示す。そして、時刻TD>TD11>TD2>TD12の順で、夫々番組Dの見出し画像、コーナD11の見出し画像、シーンD2の見出し画像、コーナD12の見出し画像が表示された場合を示す。これらの見出し画像は、レベル判定部30により、そのメインレベルが同一であって、サブレベルが番組D>コーナD11=D12>シーンD2であることが決定されている。
【0067】
上述したように、このようにレベル判定部30において決定されたレベルに基づき、更新判定部40において、メモリ60に既に記録されている画像の階層のレベルが比較され、既存の画像より階層が高い画像が検出された場合は、メモリ60の画像が更新される。
【0068】
図8に示すように、現時点での時刻T=TD12である場合、メモリ60には、番組D、コーナD11、シーンD2の見出し画像が保存されている。ここで、コーナD12の見出し画像が更新判定部60に供給されると、更新判定部60では、新たに供給されたコーナD12の見出し画像の階層とメモリ60に保存されている各画像の階層とを比較し、新たに供給された画像の階層、即ちメインレベル以下の画像、メインレベルが同一である場合はそのサブレベルのレベル以下の画像を削除する。即ち、番組D、コーナD11、シーンD2のうち、コーナD2を示す見出し画像は、時刻Tにおいて抽出され新たに供給されたコーナD12を示す見出し画像より階層レベル(サブレベル)が低いので削除され、コーナD11を示す見出し画像は、新たに供給されたコーナD12を示す見出し画像と階層レベル(サブレベル)が同一であるため削除され、番組Dを示す見出し画像は、新たに供給されたコーナD12を示す見出し画像より階層レベル(メインレベル)が高いので、そのまま保持される。ここで、供給された画像がシーンD2を示す見出し画像よりサブレベルが低かった場合は、全ての画像は保持されると共に、供給された画像も保持されることになる。
【0069】
図8に示す例では、コーナD12の見出し画像が供給された時刻Tにおいて、コーナD11及びシーンD2はその放映が終了しているため、これらの見出し画像は既に有効ではなくなっており、このような有効期間に応じたメインレベル及びサブレベルを設定しておくことにより、レベルに応じて画像を更新することができ、その時刻Tにおいて、有効な画像のみを表示できる。ここで、本実施の形態においては、図6に示すレベル判定テーブルのメインレベルA〜Gの7つのメインレベルのうち、E,Fのみサブレベルが存在するものとする。このサブレベルについても、メインレベルと同様に、適宜必要に応じて設定するものとし、例えば全てのメインレベルについても設定してもよい。
【0070】
次に、本実施の形態における画像表示装置の動作について説明する。先ず、レベル判定部30の動作について説明する。図9は、レベル判定部30において、供給される表示候補画像のレベルを決定する方法を示すフローチャートである。レベル判定部30は、予め用意された図6に示すレベル判定テーブルの他に、現在有効である見出し画像のデータが、その階層が高い順序に記録された有効見出しテーブルを有し、先ず、レベル判定テーブルを参照して表示候補画像の特徴からそのメインレベルを決定し、この表示候補画像のメインレベ及び特徴と、有効見出しテーブルのレベル及び特徴とを比較することにより、表示候補画像のレベル値を決定し、出力するものである。更新判定部40は、表示候補画像のレベル値を使用して更新判定を行う。本実施の形態においては、見出し画像の階層が高い順に、レベル値を1、2、3、・・・として設定していくものとする。
【0071】
図9に示すように、先ず、特徴抽出部20で得られた特徴及び時刻とから、図6に示すレベル判定テーブルを基に、表示候補画像のメインレベルを求める(ステップS1)。ここで、条件を満たすメインレベルが存在するか否かを判定し(ステップS2)、表示候補画像がいずれのメインレベルの条件も満たさなかった場合は処理を終了する。
【0072】
次に、現在有効である見出し画像の情報が記述された有効見出しテーブルを読み出す(ステップS3)。図10は、有効見出しテーブルを示す図である。図10に示すように、有効見出しテーブルには、過去に入力され、現在においても有効であると推定される見出し画像のメインレベル、文字の大きさ、背景特徴が記録されている。更に、サブレベルが存在するときはそのサブレベルの高さも記録されている。ここでは、サブレベルは、その階層が高い順に1から順に番号を付すものとする。また、有効見出しテーブルにおける文字の大きさは、背景が自然画像のとき使用し、背景特徴は、背景が人工画像のとき使用するものとする。そして、現在有効である見出し画像が、メインレベルの高い順で、メインレベルが同一の場合はサブレベルの高い順に、レベル値が1から順に設定されて記録されている。
【0073】
図9に戻って、ステップS3で図10に示す有効見出しテーブルを読み出した後、レベル値が高い順にテーブルのメインレベルと表示候補画像のメインレベルとを比較する。即ち、先ず、レベル値i(=1)のメインレベルと表示候補画像のメインレベルとを比較し(ステップS4)、表示候補画像のメインレベルの方が小さい場合は、有効見出しテーブルのレベル値iをインクリメント(i=2)とし(ステップS6)、再び、レベル値i=2のメインレベルと表示候補画像のメインレベルとを比較する。このように、表示候補画像のメインレベル以下となるまで、有効見出しテーブルのレベル値iをインクリメントし、ステップS5及びステップS6を繰り返す。
【0074】
そして、ステップS5で、表示候補画像のメインレベルが有効見出しテーブルのメインレベル以下であるレベル値i=Iに達した場合、メインレベルが同一であるか否かが判定され(ステップS7)、同一である場合、そのメインレベルがA,B,C,D,Gであるか否かが判定される(ステップS8)。即ち、上述したように、本実施の形態においては、メインレベルE,Fのみサブレベルを設定しているので、その他のメインレベルの表示候補画像が供給された場合、これと同一のメインレベルを有するレベル値i=I以下の見出し画像は削除する。また、ステップS7で、表示候補画像のメインレベルと有効見出しテーブルのレベル値i=Iのメインレベルとが一致しない場合、即ち、表示候補画像のメインレベルが見出しテーブルのレベル値i=Iにおけるメインレベルより小さくなった場合は、表示候補画像のレベル値をi=Iとして出力する(ステップS12)と共に、表示候補画像のデータを有効見出しテーブルのレベル値i=Iの位置に書き込み、それ以下のレベル値iを有する有効見出しテーブルの見出し画像を削除する(ステップS13)。
【0075】
ステップS8において、表示候補画像がメインレベルE,Fの場合、ステップ9に進み、レベル値i=Iの見出し画像における特徴、即ち、文字の大きさ及び背景特徴が類似しているか否かを判定する。そして、ステップS9にて、類似度が所定の閾値以上である場合、有効見出しテーブルから読み出す見出し画像のレベル値i=I+1とし(ステップS10)、このレベル値i=I+1におけるメインレベルと表示候補画像のメインレベルとを比較し(ステップS11)、メインレベルが同一である場合は、再びステップS9に戻って処理を繰り返す。一方、ステップS11において、メインレベルが同一でないとされた場合、即ち、表示候補画像のメインレベルの方が大きくなった場合は、上述したステップS12に進み、その時点でのレベル値、例えばレベル値i=I+1であった場合は、このレベル値i=I+1を表示候補画像のレベル値として出力し(ステップS12)、有効見出しテーブルを更新する(ステップS13)。
【0076】
次に、有効見出しテーブル更新方法について更に具体的に説明する。図9のステップS8において、有効見出しテーブルのレベル値i=Iのメインレベルと表示候補画像のメインレベルとが同じで且つメインレベルがA,B,C,D,Gの場合は、その時のレベル値i=Iを出力し、テーブルの更新を行うが、テーブルの更新は、具体的には、表示候補画像のレベル値として出力したレベル値iにおけるテーブルのデータを表示候補画像のパラメータに更新し、出力したレベル値iより大きいレベル値を有するデータ(レベル値iに該当するデータよりも階層が低い画像のデータ)をテーブルから消去するものである。図11(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、有効見出しテーブルのレベル値i=I=1のメインレベルと表示候補画像のメインレベルがいずれもAである例を示す。図11(a)に示すように、更新前は、レベル値i=1〜4までの見出し画像のデータが保存されているが、新たに表示候補画像として、メインレベルAが供給された場合、図11(b)に示すように、レベル値i=1の位置のデータが新たに供給された表示候補画像のデータに書き換えられ、保存されていたレベル値i=2以下の見出し画像のデータは破棄される。
【0077】
また、図9のステップS8からステップS9に進む場合、即ち、テーブルのレベル値i=Iのメインレベルと表示候補画像のメインレベルとが同じ場合で、メインレベルがE,Fの場合は、サブレベルが高い順、即ち、レベル値が小さい順に、背景が自然画像の場合は文字の大きさ、背景が人工画像の場合は背景特徴を比較する。図12(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、表示候補画像のメインレベルがE、テーブルに記憶されているメインレベルEの画像とは類似度が低い場合のテーブル更新例を示す。
【0078】
図12に示すように、テーブルのレベル値i=I=2において、そのメインレベルと表示候補画像のメインレベルが一致するため、ステップS9においてその類似度が判定される。ここで、レベル値i=I=2との類似度が所定の閾値以下であるため、表示候補画像のメインレベルEのサブレベルはサブレベル1より階層が低いと判定される。そして、ステップS10において、レベル値i=I+1=3とされ、ここでもメインレベルが一致するため、再び類似度判定される。そして、ここでも類似度が閾値以下であるため、表示候補画像のメインレベルEのサブレベルはサブレベル2より更に階層が低いと判定される。そして、再びステップS10において、レベル値i=I+2=4とされ、この場合は、メインレベルがレベル値i=4のメインレベルFより高くなるため、表示候補画像は、レベル値i=4の位置のデータと書き換えられる。
【0079】
一方、有意に類似度が高いものがあれば、即ち、例えば、図12(a)において、レベル値i=2において、類似度が高い場合、表示候補画像のメインレベルEのサブレベルは、有効見出しテーブルのレベル値i=2のサブレベルと同一、即ち、サブレベルが1と判定され、その時のレベル値i=2のデータが表示候補画像のデータと書き換えられ、レベル値i=2より大きいレベル値、即ちレベル値i=2より下の階層のデータが破棄される。このような同一メインレベルにおける類似度の判定は、背景が自然画像の場合は、文字の大きさの差が所定の閾値以下であるか否かで判断し、背景が人工画像の場合は、背景特徴の相関係数が所定の閾値以上か否かで判定することができる。
【0080】
更に、図13(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、表示候補画像のメインレベルがBでレベル値i=2と書き換えられる例を示す。図13(a)に示すように、図9のステップ7において、表示候補画像のメインレベルBがテーブルのレベル値i=I=2のメインレベルEよりも大きいため、ステップS12,13に進み、図13(b)に示すように、レベル値i=I=2のデータと書き換えられ、レベル値i=2より大きいデータは破棄される。
【0081】
次に、更新判定部40の動作について詳細に説明する。図14は、更新判定部の更新判定方法を示すフローチャートである。
【0082】
図14に示すように、先ず、更新判定部40は、予め図2に示す表示装置制御部50から与えられた自身のID番号を読み出す(ステップS21)。次に、上述したように、レベル判定部30で決定して出力される表示候補画像のレベル値iを受け取る(ステップS22)。そして、表示候補画像のレベル値iの値が自身のID値以下であるか否かを判定する(ステップS23)。表示候補画像のレベル値iが自身のID値以下であるである場合は、表示候補画像のレベル値i=自身のID値であるか否かを判定し(ステップS24)、同一である場合は、表示候補画像を見出し画像(表示用画像)と判定してメモリ60に書き込み、メモリ60内の画像を更新する。表示候補画像のレベル値iの値が自身のIDより小さい場合は、表示候補画像が現在記憶されている見出し画像よりも高い階層の見出し画像であることを示す、即ち、記憶されている見出し画像の有効期間が切れたことを示し、従って、メモリ60内の有効期間切れの見出し画像を消去する(ステップS26)。一方、ステップS23において、表示候補画像のレベル値iの値が自身のID番号より大きい場合は、表示候補画像がメモリ60に記憶されている見出し画像よりも更に下の階層の見出し画像であることを示し、従って、この時点ではメモリ60に記憶されている見出し画像の期限は有効であるためそのまま保持して、処理を終了する。
【0083】
このように構成された画像表示装置10により、抽出されメモリ60に記録されている現在有効である画像(表示用画像)は、各表示装置801〜80Nにおいて表示される。本実施の形態においては、各表示装置801〜80Nは自身のID(1〜N)を有し、各表示装置801〜80Nに表示されている画像は、このIDに対応してレベル値が小さい順、即ち階層が高い順に、有効期間内の見出し画像のみを表示することができる。
【0084】
図15は、図2の画像表示システムにおける複数の表示装置により、見出し画像を表示した様子を示す模式図である。図15(b)に示す中央のモニタは、表示装置70を示し、テレビジョン放映された通常の映像が表示されている。図15(a)及び(c)は、夫々表示装置801、802に表示される画像を示し、夫々番組のタイトル及びコーナのタイトルを示す見出しを含む画像を表示している。
【0085】
例えば、ある番組EのあるコーナE1のあるシーンE2が放映されている場合、図15(a)に示すように表示装置801には、番組Eの番組タイトルを示す見出し画像が、図15(b)に示すように、表示装置802には、コーナE1のタイトルを示す見出し画像が、また、表示装置803(図示せず)には、シーンE2を示す見出し画像が表示される。こうして複数台の表示装置801〜80Nに、階層順の見出し画像を表示することができる画像表示装置を接続することにより、視聴者は、番組の途中から視聴を始めた場合においても、そのときのコーナ又はシーン等が何であるかを直ちに把握することができて便利である。
【0086】
また、上述の実施の形態においては、抽出された複数の見出し画像を表示可能な複数の表示装置を設けるものとしたが、例えば1つの表示装置の表示領域を4分割して、所定の領域に階層毎の見出し画像が同時に表示されるように、抽出された複数の見出し画像を合成するようにしてもよい。これにより、表示装置が通常の映像を視聴する表示装置の他に見出し画像表示用のモニタを1台用意するのみで、複数の見出し画像を同じに表示できて便利である。更に、上述の実施の形態においては、表示装置に見出し画像を表示するものとしたが、見出し画像に含まれる見出し(文字情報)領域のみを抽出して表示するようにしてもよい。
【0087】
次に、上述した図3に示す特徴抽出部20の前段に設けられる文字情報検出装置の具体例について説明する。図16は、本具体例における文字情報検出装置におけるデータの流れを説明する説明図である。図16に示すように、文字情報検出装置は、入力画像データが供給されるフレーム画像判定部(判定手段)210と、フレーム画像判定部210からのデータが供給され、画面上に予め設定されたテロップ出現領域(文字情報出現領域)において、このテロップ出現領域にテロップが出現するか否かを検出するテロップ出現検出部(文字情報出現フレーム画像検出手段)220と、フレーム画像判定部210又はテロップ出現検出部220からフレーム画像が供給され、そのテロップ出現領域のエッジ密度が所定の閾値以上であるとき、このテロップ出現領域をテロップ候補として検出するエッジ密度検出部230と、エッジ密度検出部230により検出されたテロップ候補を既検出テロップ候補として記憶する記憶部240と、既検出テロップ候補がこの既検出テロップ候補を有するフレーム画像に時間的に連続する複数のフレーム画像におけるテロップ候補との輝度変化の割合が所定の閾値以下である静止期間を検出しこの静止期間が所定値に達したとき当該既検出テロップ候補をテロップと推定する推定部250と、推定部250により推定されたテロップ候補と、実際に提示済みのテロップとの類似度を比較し、類似していないテロップ候補のみをテロップとして出力するテロップ類似度検出部260と、テロップ類似度検出部260から出力されるテロップを保持し、複数のテロップを合成してリスト状にして提示画像を生成する提示画像生成部(提示手段)270とから構成されている。
【0088】
テロップ出現検出部220は、フレーム全体の輝度変化を検出する候補フレーム画像検出部221とテロップ出現領域の輝度変化を検出する局所変化検出部222とを有する。
【0089】
また、推定部250は、エッジ密度検出部230から供給されるデータと記憶部240に記憶されている既検出テロップ候補との類似度を比較する類似度検出部251と、既検出テロップ候補が記憶部40に保持される期間を検出する継続カウンタ252と、継続カウンタ252及び類似度検出部251からのデータに基づき既検出テロップ候補の安定度を判定する安定度判定部53から構成されている。
【0090】
以下、この文字情報検出装置について更に詳細に説明する。文字情報検出装置には、時系列のフレーム単位の画像データが入力される。ここで、後述するテロップ出現検出部220においてテロップ出現領域にテロップの出現が検出された時点及びエッジ密度検出部230でテロップ出現領域のエッジ密度が所定の閾値以上のもの(テロップ候補(候補ベクトル))が検出された時点で、これを示すフラグ(stateflg)に1が設定される。このフラグ(stateflg)は、その後のフレーム画像のテロップ出現領域がテロップ候補ではないと判定された時点、具体的には、後述するが、エッジ密度検出部230においてテロップ出現領域のエッジ密度が所定の閾値未満であることが検出された時点、テロップ類似度検出部260で同様の既に提示済みのテロップが検出された時点、及び提示画像生成部270からテロップと確定されて出力された時点で0が設定されるものである。
【0091】
フレーム画像判定部210は、入力フレーム(iフレーム)が入力された時点で、このフラグ(stateflg)が0であるか、又は1であるかにより、既に文字情報候補が検出されているか否かを判定するものである。テロップは出現した後、一定時間の安定状態を有することから、iフレームが入力された時点で、既に過去のフレームにおいてテロップの出現又はテロップ候補が検出されていれば、iフレームではテロップ出現中とみなすことができる。従って、テロップ出現検出部220における処理は不要であるため、フラグ(stateflg)が1である間は、フレーム画像をエッジ密度検出部230に供給する。
【0092】
テロップ出現検出部220は、フラグ(stateflg)が0である間、判定部210からフレーム画像が供給される。そして、時間的に近接するフレーム画像間の輝度変化からテロップ出現領域におけるテロップの出現を検出するものである。入力フレーム(iフレーム)テロップ出現領域の輝度と、時間的に近接する例えば(i−2)フレームのテロップ出現領域との輝度とを比較すれば、iフレームテロップ出現領域にテロップが出現する場合、その輝度が変化するため、この輝度変化を検出することにより、iフレームテロップ出現領域にテロップが出現するか否かが判定できる。
【0093】
ここで、テロップ出現領域のみの輝度変化を検出すると、例えばシーンチェンジ等のようにフレーム全体の輝度が変化している場合にもテロップ出現領域の輝度変化が検出されてしまう。これを防止するため、候補フレーム画像検出部221により、近接フレーム画像間のフレーム全体の輝度変化を調べ、この輝度変化が所定の閾値以下であるものを局所変化検出部222に供給する。
【0094】
そして、局所変化検出部222は、近接フレームのテロップ出現領域間で輝度の局所変化を検出し、この輝度変化が所定の閾値以上であれば、テロップが出現するものと判断し、フラグ(stateflg)に1を立てると共に、このフレーム画像(文字情報出現フレーム画像)をエッジ密度検出部230に供給する。
【0095】
次に、候補フレーム画像検出部221及び局所変化検出部222について具体的に説明する。候補フレーム画像検出部221は、例えば図17のように構成された輝度ヒストグラム生成部280に対して入力フレーム画像を送り、フレーム全体の輝度ヒストグラムを利用して候補フレーム画像を検出することができる。輝度ヒストグラム生成部280は、フレーム画像判定部210からのフレーム画像のデータ(以下、フレームデータという。)が供給されるブロック分割部281及び遅延回路283、遅延回路283により所定時間遅延されたフレームデータが供給されるブロック分割部284、並びに、ブロック分割部281及び284により所定のサイズのブロックに分割されたフレームデータが供給されブロック毎の輝度ヒストグラムを計算する夫々ヒストグラム計算部282及び285から構成されている。
【0096】
このように構成された輝度ヒストグラム生成部280に対して、候補フレーム画像検出部221が、フレーム画像判定部210から供給されるiフレームの画像データを供給する。輝度ヒストグラム生成部280は、ブロック分割部281により、供給されたiフレームの画像データ(情報列)を空間が規定サイズとなるブロックに分割し、このブロック単位のデータをヒストグラム計算部282に送る。
【0097】
また、このiフレームの画像データは、同時に遅延回路283にも供給され、遅延回路283により、例えば2フレーム分遅延された画像データがブロック分割部224に供給される。
【0098】
ブロック分割部284は、ブロック分割部281と同様に、(i−2)フレームの画像データ(情報列)を空間の規定サイズブロックに分割し、このブロック単位のデータをヒストグラム計算部285に送る。
【0099】
ヒストグラム計算部282,285は、全画面において、ブロック単位で輝度ヒストグラムを計算し、この結果を候補フレーム画像検出部221に送る。
【0100】
そして、候補フレーム画像検出部221は、ヒストグラム計算部282,285からのデータ、即ち、iフレームのブロック単位の輝度ヒストグラムと、(i−2)フレームのブロック単位の輝度ヒストグラムとが供給されると、iフレームと(i−2)フレームとの間において、空間的に対応するブロック毎に輝度ヒストグラムの相関係数を求め、予め決められた閾値(Th_coef1)と比較し、相関係数が所定の閾値(Th_coef1)以下であるブロックを変化ブロックと判定する。下記式(1)に相関係数を求める際の式を示す。
【0101】
【数1】
【0102】
そして、この変化ブロックの割合が所定の閾値(Th_diff1)以下であるiフレームを候補フレーム画像として検出する。ここで、変化ブロックの割合が閾値(Th_diff1)より大きい場合は、現フレーム(iフレーム)の処理を終了し、次のフレーム((i+1)フレーム)の処理へ進む。
【0103】
また、局所変化検出部222も、候補フレーム画像検出部221と同様に、候補フレーム画像検出部221により検出されたiフレーム及び(i−2)フレームのデータが供給され、両者の上記文字情報出現領域において、候補フレーム画像検出部221と同様に、空間的に対応するブロック毎に輝度ヒストグラムの相関係数が所定の閾値(Th_coef1)以下である変化ブロックの割合が所定の閾値(Th_diff2)以上であるiフレームを検出する。ここで変化ブロックの割合が所定の閾値(Th_diff2)以上であった場合は、上述した如くフラグ(stateflg)に1を立てると共にこのデータをエッジ密度検出部230に供給する。一方、変化ブロックの割合が閾値(Th_diff2)より小さい場合は、現フレーム(iフレーム)の処理を終了し、次のフレーム((i+1)フレーム)の処理へ進む。これは近接するフレームの文字情報出現領域間の変化が小さい場合は、iフレームのテロップ出現領域においてテロップの出現は検出されなかったと判断し、このフレームについての後段の処理を省略するためである。
【0104】
このように、テロップ出現検出部220によって、全ブロック中の変化ブロックの割合とテロップ出現領域における変化ブロックの割合とを計算し、全ブロック中の変化ブロックの割合が予め決めた閾値以下であり、且つ、テロップ出現領域における変化ブロックの割合が予め決めた閾値以上である場合は、局所変化が存在する、即ち、テロップの出現と判定することができる。
【0105】
なお、本具体例においては、輝度ヒストグラム生成部280を用意し、候補フレーム画像検出部221の要求に応じて輝度ヒストグラムを生成するものとしたが、候補フレーム画像検出部221及び局所変化検出部222において、図17に示すようなブロック分割部281,284及びヒストグラム計算部282,285等を個別に有するものとしてもよい。また、遅延回路283による遅延時間は、2フレーム分としたが、例えば1フレーム又は3フレーム等、フレーム間の変化の割合を検出することができる範囲で任意に設定可能である。
【0106】
図16に戻って、エッジ密度検出部230は、フラグ(stateflg)が1である間、フレーム画像か供給され、このテロップ出現領域のエッジ密度を計算する。なお、ここで、エッジ密度検出部230に供給される画像データは、フレーム全体のデータであっても、テロップ出現領域のみのデータであってもよい。
【0107】
エッジ密度検出部230は、このフレーム画像のテロップ出現領域のエッジ密度が所定の閾値以上であるとき、当該テロップ出現領域をテロップ候補として検出する文字情報候補検出手段である。即ち、フレーム画像のテロップ出現領域におけるエッジ密度を算出し、テロップであればエッジ密度が高いという特徴から、テロップ出現領域のエッジ密度が所定の閾値(Th_den)以上のものをテロップ候補として検出する。ここで、テロップ出現領域のエッジ密度が所定の閾値(Th_den)未満であるときは、フラグ(stateflg)を0とする。これにより、以降のフレーム画像は、フラグ(stateflg)に1が設定されるまでの間、テロップ出現検出部220に供給されるようになる。
【0108】
記憶部240には、エッジ密度検出部230において検出されたテロップ候補が既検出テロップ候補として記憶される。即ち、現フレーム(iフレーム)より過去のフレームにおいてテロップ候補として検出されたテロップ出現領域のデータが既検出テロップ候補として記憶されており、後述する推定部250において、この既検出テロップ候補と、この既検出テロップ候補と時間的に連続する所定数のフレームにおいて検出されたテロップ候補とが比較されることにより、既検出テロップ候補がテロップであるか否かが推定される。即ち、既検出テロップ候補を有するフレームに時間的に連続するフレームにおいてエッジ密度検出部230によりテロップ候補が検出されなかった場合は、その時点で既検出テロップ候補は不要となる。従って、既検出テロップ候補を有するフレームに時間的に連続するフレームにおいてエッジ密度検出部230によりテロップ候補が検出されなかった場合、エッジ密度検出部230は、記憶部240に記憶されている既検出テロップ候補を初期化(破棄)し、後述する継続カウンタ252のカウント値をリセットし、フラグ(stateflg)を0とし、次のフレームの処理へ移る。
【0109】
推定部250は、記憶部240に保持されている既検出テロップ候補と、この既検出テロップ候補を有するフレーム画像に連続する所定数のフレーム画像におけるテロップ候補とのエッジ密度の変化の割合が所定の閾値以下であるとき、当該既検出テロップ候補をテロップと推定する検出手段である。
【0110】
継続カウンタ252は、テロップが安定して出現したフレーム数(静止期間)をカウントするものである。例えば、エッジ密度検出部230及び後述する類似度検出部251等において、記憶部240に記憶されている既検出テロップ候補は、これに続くフレームのテロップ候補と比較されることにより、既検出テロップ候補がテロップとしての特徴から外れる場合は、テロップ候補と置き換えられ、このとき、継続カウンタ252のカウント値がリセットされる。上述したように、テロップであれば、数フレームは安定して出現することから、継続カウンタ252により、記憶部240に記憶されている既検出テロップ候補が置き換えられることなく保持される連続フレーム数をカウントする。推定部250は、このカウント値から既検出テロップ候補がテロップであるか否かを最終的に推定するものである。
【0111】
類似度検出部251は、既検出テロップ候補と、これより後(未来)のフレームにおいて検出されたテロップ候補との類似度を検出する類似度検出手段である。即ち、エッジ密度検出部230により検出されたエッジ密度が所定の閾値以上であるテロップ出現領域(テロップ候補)が供給され、このテロップ候補と、上記既検出テロップ候補との相関を比較する。具体的には、上述の候補フレーム画像検出部221及び局所変化検出部222と同様に、空間的に対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値(Th_coef2)以上である場合、テロップ候補のテロップと、既検出テロップ候補のテロップとは、同一のものであると判断する。この場合は、更に、テロップ候補のエッジ密度と、既検出テロップ候補のエッジ密度とを比較し、両者のうち、エッジ密度が高い方のデータを既検出テロップ候補とする。即ち、既検出テロップ候補のエッジ密度の方が高ければ、記憶部240に記憶されているデータはそのまま保持されるが、テロップ候補の方がエッジ密度が高い場合は、記憶部240のデータ(既検出テロップ候補)をテロップ候補のデータと置き換える。このように、エッジ密度が高いものを選択することにより、より鮮明なものを抽出することができる。
【0112】
ここで、記憶部240に記憶されている既検出テロップ候補が置き換えられた(書き換えられた)場合は、継続カウンタ252のカウント値をリセットする。一方、記憶部240に記憶されている既検出テロップ候補をそのまま保持した場合は、継続カウンタ252のカウント値をインクリメントする。
【0113】
また、相関係数が所定の閾値(Th_coef2)未満である場合、iフレームテロップ出現領域に出現している可能性のあるテロップは、既検出テロップ候補に出現している可能性のあるテロップとは異なるものと判定され、iフレームテロップ出現領域のデータを記憶部240に供給し、記憶されている既検出テロップ候補をiフレームテロップ出現領域のデータに置き換えると共に、継続カウンタ252のカウント値をリセットする。
【0114】
このように、類似度検出部251は、テロップ候補と、記憶部240に記憶された既検出テロップ候補との類似度が所定の閾値以上であって、既検出テロップ候補のエッジ密度よりテロップ候補のエッジ密度の方が高いとき、また、上記類似度が所定の閾値未満であるとき、記憶部240の既検出テロップ候補をiフレームのテロップ候補に入れ替える入替手段としても機能する。
【0115】
安定度判定部253は、既検出テロップ候補が記憶部240に保持される期間を検出する期間検出手段として、継続カウンタ252のカウント値を検出する。上述したように、テロップであれば、数フレーム間は安定に出現することから、カウント値が予め設定された所定値である場合に、記憶部240に記憶されている既検出テロップ候補がテロップであると推定し、これをテロップ類似度判定部260に送る。一方、カウント値が所定値以外、例えば所定値未満である場合は、この既検出テロップ候補がテロップとしての安定度が低いと判定し、また所定値より大きい場合は、既にテロップ類似度判定部260に送られたものと判定し、記憶部240の既検出テロップ候補及び継続カウンタ252のカウント値を保持しつつ、次のフレームの処理へ進む。ここで、カウント値が所定値未満であった場合、以降のフレーム処理により、カウント値がインクリメントされ所定値に達した場合は、この既検出テロップ候補がテロップと推定されて類似度検出部260に送られる。
【0116】
また、既検出テロップ候補をテロップと推定してテロップ類似度検出部260に送出した後は、記憶部240に記憶されている既検出テロップ候補、及び継続カウンタ252のカウント値はそのまま保持することにより、以降のフレームにおいて、この既検出テロップ候補と同一のテロップ候補が検出され、カウンタ値がインクリメントされれば、カウンタ値が所定値より大きくなるため、テロップ類似度検出部260には送出されず、同一のテロップを出力することを防止することができる。
【0117】
テロップ類似度検出部260は、安定度判定部253により、既検出テロップ候補がテロップと推定された既検出テロップ候補と、既に提示されているテロップとを比較しその類似度が所定の閾値以下であるとき、当該既検出テロップ候補をテロップとして検出する文字情報検出手段である。即ち、既にテロップと判定され、例えば既に提示されたテロップ、又は、後述する提示画像生成部270に保持されているテロップ等の既検出テロップと、安定度判定部253によりテロップであると判定された既検出テロップ候補とを比較し、既検出テロップと類似していない既検出テロップ候補のみ検出し、これをテロップとして提示画像生成部270に送る。これにより、既検出テロップ候補が既にテロップとして判定され出力されているものと同じ場合には出力しないようにすることができる。このテロップ類似度判定部260により、既検出テロップ候補が既にテロップとして出力されていると判定された場合は、この既検出テロップ候補のデータを初期化し、次のフレームの処理に進む。
【0118】
提示画像生成部270は、類似度判定部260により検出された1以上の既検出テロップを合成し提示画像を生成して他の画面に表示する提示手段である。提示画像生成部270は、所定数のテロップを保持して表示し続けるため、テロップの出現領域が例えば水平方向の帯状の領域に設定されている場合、この帯状の領域を切出し、例えは垂直方向に並べることでリスト表示を行っている。新しいテロップが検出される度に既存テロップをスクロールし、画像を更新して出力する。
【0119】
このように、文字情報検出装置は、先ず、テロップ出現検出部220により、入力画像データの輝度変化からテロップの出現を検出し、エッジ密度検出部230により、出現を検出した文字情報出現領域のエッジ密度からテロップ゜候補を検出し、推定部250により、テロップ候補の出現している期間を検出することによりテロップ候補が確実にテロップであるか否かを推定し、必要に応じて類似度類似度判定部60を設け、これによりテロップが何度も検出されないようにして、提示画像を生成するものである。
【0120】
以下、本具体例における文字情報検出方法について詳細に説明する。図18は、図16に示すフレーム画像判定部210及びテロップ出現検出部220の処理方法を示すフローチャートである。上述したように、文字情報を検出する際には、予めテロップ出現領域を画面上に設定する。以下の説明においては、テロップ出現領域を画面下部に設定した場合について説明する。なお、複数のテロップ出現領域を設定する場合は、各テロップ出現領域について同様の処理を行うものとする。
【0121】
図18に示すように、図16のフレーム画像判定部210にiフレームの画素値F(i,pxl)が入力されると、上述したフラグ(stateflg)が1であるか0であるかが検出される(ステップS51)。ここで、フラグ(stateflg)が1である間は、後述するステップS59に進む。一方、フラグ(stateflg)が0である間は、ステップS52及びS53に進む。
【0122】
ステップS52では、ヒストグラム生成部280のヒストグラム計算部285から(i−2)フレームの全画面においてブロック単位で計算された輝度ヒストグラムH(i−2,j)を読み込む。ここで、jは、フレーム内のj番目のブロック(ブロックNo.)を示し、輝度ヒストグラムH(i−2,j)は、(i−2)フレームにおけるj番目のブロックの輝度ヒストグラムを示す。このとき、同時に、ヒストグラム計算部282で、iフレームの全画面において、ブロック毎の輝度ヒストグラムが計算され、このiフレームにおける輝度ヒストグラムH(i,j)がフレーム変化検出部226に供給される(ステップS3)。本具体例においては、フレーム画像を例えば720×480ピクセル等とすることができ、ブロックサイズを例えば32×32ピクセル等とすることができる。
【0123】
次に、ステップS54では、局所変化検出部226が、輝度ヒストグラムH(i−2,j)と輝度ヒストグラムH(i,j)とから対応ブロック毎に相関係数e1(j)を計算し、この相関係数e1(j)と所定の閾値(Th_coef1)とを比較し、相関係数e1(j)が、閾値(Th_coef1)以下であれば、変化ブロックと判定する。
【0124】
そして、ステップS54で判定した全ブロックに対する変化ブロックの割合e1(j)が、所定の閾値(Th_diff1)以下であるか否かを判定し(ステップS5)、閾値(Th_diff1)より大きい場合は、現フレームの処理を終了し、次のフレームの処理へ進む。一方、変化ブロックの割合e1(j)が閾値(Th_diff1)以下である場合は、ステップS56に進む。
【0125】
ステップS56では、局所変化検出部222において、ヒストグラム計算部282,285からのデータにより、フレーム内のテロップ出現領域、即ち、本具体例の場合は、例えば64×576ピクセルのサイズを有する画面中央下部領域内の全ブロックに対する変化ブロックの割合e2(j)を計算し、ステップS57において、変化ブロックの割合e2(j)が所定の閾値(Th_diff2)以上であるか否かを判定する。変化ブロックの割合e2(j)が所定の閾値(Th_diff2)未満である場合は、現フレームの処理を終了して、次のフレームの処理へ進む。一方、変化ブロックの割合e2(j)が所定の閾値(Th_diff2)以上である場合は、ステップS58に進み、iフレームのテロップ出現領域はテロップ候補であるとみなし、テロップ候補が検出されたことを示すフラグ(stateflg)に1をたて、iフレームの画素値F(i,pxl)を推定部250へ送る。これにより、以降のフレーム画像の処理は、フラグ(stateflg)が1である間は、ステップS52乃至ステップS58の処理を行わず、ステップS51からステップS59に進む処理がなされることになる。
【0126】
次に、ヒストグラム生成部280において、輝度ヒストグラムを計算する方法について更に詳細に説明する。図19は、ヒストグラム生成部280によりブロック単位で計算された輝度ヒストグラムから候補フレーム画像を検出する方法を示すブローチャートである。
【0127】
図19に示すように、先ず、ブロック分割部281にiフレームの画像データが入力され、このフレーム画像データを規定サイズ、例えば、32×32ピクセルのサイズのブロックに分割する(ステップS71)。ブロック分割されたデータはヒストグラム計算部282に送られ、ここで、j番目のブロックの輝度ヒストグラムH(i,j)を計算する(ステップS72)。次に、ヒストグラム計算部285から、(i−2)フレームのj番目のブロックの輝度ヒストグラムH(i−2,j)を読み込む(ステップS73)。
【0128】
次に、ステップS72で得られた輝度ヒストグラムH(i,j)と、ステップS73で得られた輝度ヒストグラムH(i−2,j)とから、上記式(1)により、ヒストグラムの相関係数e1(j)を計算し(ステップS74)、閾値(Th_coef1)により変化を判定する(ステップS75)。この変化の判定には、例えばフラグE(i,j)を使用し、iフレームのj番目のブロックは変化がある(変化ブロック)と判定された場合は、フラグE(i,j)=1とし、変化ブロックではないと判定された場合は、フラグE(i,j)=0とする。そして、(i+2)フレームのフレーム変化を検出する際に使用するため、H(i,j)を保持すると共に、候補フレーム画像検出部21内のブロックNo.をカウントするカウンタ値jをインクリメントする(ステップS76)。そして、全ブロックについて、ステップS75の閾値判定が終了しているか否かを判定し(ステップS76)、終了していない場合は、ステップS72に戻り、次のブロック(j+1番目のブロック)について、同様の処理を繰り返す。
【0129】
一方、全てのブロックにおいて処理が終了した場合は、上述したように、変化ブロックの割合が所定の閾値より大きければ、現フレーム(iフレーム)の処理を終了し、次のフレームの処理へ進み、変化ブロックの割合が所定の閾値以下である場合は、局所変化検出部222へデータを供給する。具体的には、全ブロックのフラグE(i,j)の値を加算し、これが所定の閾値より大きい場合は処理を終了し、所定の閾値以下である場合は、局所変化検出部222へデータを供給する。局所変化検出部222においても、基本的には、ステップS72乃至77と同様の処理が繰り返される。即ち、テロップ出現領域内のブロック単位の輝度ヒストグラムH(i,j)及びH(i−2,j)が順次読み込まれ、テロップ出現領域内の変化ブロックを検出する処理を行う。
【0130】
次に、推定部250における既検出テロップ候補がテロップか否かを推定する方法について説明する。図20は、推定部の推定方法を示すフローチャートである。先ず、フラグ(stateflg)=1の間、画像データがエッジ密度検出部230に送られる。ここでは、エッジ密度検出部230に送られる画像データをiフレームとする。先ず、図20に示すように、エッジ密度検出部230において、iフレームにおけるテロップ出現領域におけるエッジ画像の密度d(i)が計算される(ステップS59)。このエッジ密度d(i)が所定の閾値(Th_den)以上であるか否かが検出され(ステップS60)、エッジ密度d(i)が閾値(Th_den)未満である場合は、ステップS61に進み、記憶部240に記憶されている既検出テロップ候補を初期化、即ち、データを破棄し、継続カウンタ252のカウント値をリセットし、更にテロップ候補が検出されていることを示すフラグ(stateflg)を0にする(ステップS61)。これにより、以降のフレーム画像は、フラグ(stateflg)が1になるまで、ステップS52乃至ステップS58を繰り替えすことになる。一方、iフレームのテロップ出現領域のエッジ密度d(i)が閾値(Th_den)以上である場合は、データを類似度検出部251へ送り、ステップS62に進む。
【0131】
ステップS62では、類似度検出部251において、記憶部240に記憶されている既検出テロップ候補と、iフレームのテロップ出現領域との相関係数e(tlp)を計算する。そして、相関係数e(tlp)が所定の閾値(Th_coef2)以上であるか否かを判定する(ステップS63)。ステップS63で、相関係数e(tlp)が所定の閾値(Th_coef2)以上であると判定された場合、即ち、既検出テロップ候補とiフレームのテロップ出現領域とは同一のテロップを有するものと判定された場合はステップS64に進み、記憶部240に記憶されている既検出テロップ候補のエッジ密度d(tlp)と、iフレームのテロップ出現領域のエッジ密度d(i)とが比較される(ステップS64)。そして、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)以上であるか否かが判定され(ステップS65)、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)以上である場合、即ち、既検出テロップ候補の方がiフレームのテロップ出現領域に出現する可能性のあるテロップよりも鮮明であると判定された場合は、ステップS67に進む。
【0132】
一方、ステップS63において、既検出テロップ候補とiフレームのテロップ出現領域との相関係数e(tlp)が所定の閾値(Th_coef2)未満である場合、即ち、iフレームのテロップ出現領域と既検出テロップ候補とでテロップが変化しているものと判断した場合と、ステップS65において、既検出テロップ候補のエッジ密度d(tlp)がiフレームのテロップ出現領域のエッジ密度d(i)より小さい場合、即ち、既検出テロップ候補よりもiフレームのテロップ出現領域に出現する可能性があるテロップの方が、エッジ密度が高く鮮明であると判断した場合は、ステップS66に進む。ステップS66では、記憶部240に記憶されている既検出テロップ候補が、現フレーム、即ち、iフレームのテロップ出現領域のデータに入れ替えられる。具体的には、既検出テロップ候補のエッジ密度d(tlp)を、iフレームのテロップ出現領域のエッジ密度d(i)に入れ替え、更に継続カウンタ252のカウント値をリセット(tlplen=0)し、ステップS67に進む。
【0133】
ステップS67においては、継続カウンタ252のカウント値をインクリメント(tlplen=++)し、ステップS68において、継続カウンタ252のカウント値(tlplen)が所定値(Th_tlplen)であるか否かが判定される。
【0134】
上述したように、テロップであれば、一定フレームの間、安定して出現する。継続カウンタ252のカウント値は、テロップが安定して出現したフレーム数を示すものである。従って、ステップS68において、カウント値が所定値(Th_tlplen)以外であると判定された場合は、カウント値及び既検出テロップ候補のデータを保持して次のフレームの処理へ進む。
【0135】
一方、カウント値が所定値(Th_tlplen)である場合、即ち、既検出テロップ候補が所定のフレーム数、出現し続けていると判定された場合は、このデータがテロップ類似度判定部260へ送られてステップS69に進む。この際、記憶部240に保持されている既検出テロップ候補及び継続カウンタ252のカウント値はそのまま保持する。
【0136】
ステップS69では、例えば、提示画像生成部270等に保持されている既にテロップと判定されものと、既検出テロップ候補との相関係数を計算し、ステップS70にて、相関係数が所定の閾値以下であるか否かが判定される。ステップS70にて相関係数が所定の閾値以下である場合、既検出テロップ候補は、まだテロップとして検出されていない新しいテロップであると判断され、このデータを提示画像生成部270へ送る。一方、相関係数が所定の閾値より大きい場合は、既検出テロップ候補に出現するテロップは既にテロップとして出力されていると判断され、次のフレームの処理に進む。
【0137】
ここで、ステップS68及びステップS69において、安定度判定部253及びテロップ類似度検出部260の夫々判定結果及び検出結果に関わらず、記憶部240の既検出テロップ候補のデータはそのまま保持され、且つ継続カウンタ252のカウンタ値もそのまま保持されているため、例えば、次に入力されるフレーム画像において同じテロップ候補が検出され、このテロップ候補のエッジ密度が既検出テロップ候補のエッジ密度より小さい場合は、継続カウンタ252のカウンタ値がインクリメントされ、所定値(Th_tlplen)を超えるため、再びテロップ類似度検出部260に送られることはない。また、テロップ候補のエッジ密度が既検出テロップ候補のエッジ密度より大きい場合は、既検出テロップ候補が置き換えられ、継続カウンタのカウント値が1となり、カウント値が所定値(Th_tlplen)に達するまで処理が繰り返される。
【0138】
以上、図20に示す工程において、記憶部240には、既検出テロップ候補が記憶されているものとして説明したが、図18に示すステップS55、ステップS58において、iフレームにおいてテロップ候補が検出されなかった場合、記憶部240に記憶されている既検出テロップ候補は初期化(破棄)される。このように、記憶部240には、既検出テロップ候補が記憶されていない状態で、推定部250にテロップ候補を有するフレーム画像が供給された場合、図20に示すステップS62乃至ステップS65における処理は不要となる。従って、既検出テロップ候補が初期化された状態でステップS60においてエッジ密度が所定の閾値以上であると判定された場合は、ステップS66に進み、フレーム画像のテロップ出現領域のデータが既検出テロップ候補として記憶される。そして、同様に、ステップS67において、継続カウンタtlplen=1として、次のフレームの処理に進む。
【0139】
このように構成された本具体例に係る文字情報検出装置においては、テロップ出現検出部220において異なるフレーム間におけるブロック単位の輝度ヒストグラムの相関を用いてテロップ出現領域における輝度変化(局所変化)を求めることで画像上の小さな変化等による誤検出を軽減することが可能となると共に、シーンチェンジ及び背景の大きな動き等による誤検出を軽減することが可能となる。また、エッジ密度検出部230によるエッジ密度を判定条件に用いることで、文字情報(テロップ)を更に精度よく検出することが可能となる。更に、類似度判定部251により、既検出テロップ候補とこれに連続するフレームのテロップ出現領域における類似度を判定すると共に、継続カウンタ252により継続して出現するフレーム数をカウントし、更に、テロップ類似度検出部260により既検出テロップとの類似度を判定することで、細かいテロップの変化等の場合にも、同内容のテロップを誤検出することを軽減することができる。
【0140】
また、本具体例においては、予めテロップ出現領域を設定しておき、文字情報を抽出するものであるので、上述した図3に示す文字特徴抽出部25において行われる文字情報の大きさ及び位置の抽出処理をこの文字情報検出装置においてまとめて行い、文字特徴抽出部における処理を省略してもよい。また、テロップ出現領域は複数設定することができるので、文字情報の位置及び大きさ(テロップ出現領域の大きさ)によって階層を設定する場合は、各階層を設定するために必要な種類全てにテロップ出現領域を設定すればよい。
【0141】
【発明の効果】
以上詳細に説明したように、本発明に係る画像表示装置は、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示装置において、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、上記表示候補画像の特徴を抽出する特徴抽出手段と、複数の階層毎に文字情報を含む画像の特徴が記憶された階層テーブルと、上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、分類された階層のレベルに基づき該表示候補画像を表示するか否かを判定する表示画像判定手段とを有するので、TV放映された映像等から、見出しとなるような文字情報を含む候補画像を抽出し、その階層を求めて表示判定を行うことにより、現在放映中の映像においてその見出しが有効であるか否かを推定し、常に有効期間内の見出しを含む画像を表示することができる。
【0142】
また、本発明に係る画像表示システムは、時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示システムにおいて、1以上の表示装置と、上記表示装置に上記所定の画像の少なくとも一部を供給する画像表示装置とを有し、上記画像表示装置は、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、上記表示候補画像の特徴を抽出する特徴抽出手段と、複数の階層毎に文字情報を含む画像の特徴が記憶された階層テーブルと、上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、分類された階層のレベルに基づき該表示候補画像を表示するか否かを判定する表示画像判定手段と、上記表示画像判定手段により表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示するよう制御する表示制御手段とを具備するので、複数の表示用画像が得られた場合に、異なる階層毎に複数の表示装置に表示することができ、視聴者は、現在放映中の映像において有効である見出しとして文字情報を含む画像の有効期間の長さ毎に分類された複数の見出し画像を同時に視ることができ視聴者の映像の理解を容易にする。
【図面の簡単な説明】
【図1】本発明の実施の形態における表示画像の有効期間と階層の順位(レベル)を説明する図である。
【図2】本発明の実施の形態に係る画像表示システムを示すブロック図である。
【図3】本発明の実施の形態に係る画像表示システムの画像表示装置における特徴抽出部を示すブロック図である。
【図4】装飾された文字情報を有する見出し画像を示す模式図である
【図5】リスト状に表示されたテロップを有する見出し画像を示す模式図である
【図6】本発明の実施の形態に係る画像表示システムの画像表示装置におけるレベル判定部のレベル判定テーブルを示す模式図である。
【図7】本発明の実施の形態に係る表示画像のメインレベル及びサブレベルの関係を説明する図である。
【図8】レベルを比較することで有効期間内の文字情報を含む画像を表示する仕組みを説明する図である
【図9】本発明の実施の形態に係る画像表示システムの画像表示装置におけるレベル判定部において階層レベルを推定して更新する方法を示すフローチャートである。
【図10】レベル判定部において使用される有効見出しテーブルを示す図である
【図11】(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、有効見出しテーブルのレベル値i=I=1のメインレベルと表示候補画像のメインレベルがいずれもAである例を示す。
【図12】(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、表示候補画像のメインレベルがE、テーブルに記憶されているメインレベルEの画像とは類似度が低い場合のテーブル更新例を示す。
【図13】(a)及び(b)は、夫々更新前後の有効見出しテーブルを示す図であって、表示候補画像のメインレベルがBでレベル値i=2と書き換えられる例を示す
【図14】本発明の実施の形態に係る画像表示システムの画像表示装置における更新判定部の更新判定方法を示すフローチャートである。
【図15】本発明の実施の形態に係る画像表示システムにおける複数の表示装置により、見出し画像を表示した様子を示す模式図である。
【図16】本発明の具体例に係る文字情報検出装置におけるデータの流れを説明する説明図である。
【図17】輝度ヒストグラムを生成する際のデータの流れを説明する説明図である。
【図18】本発明の具体例に係る文字情報検出方法を示す図であって、フレーム画像判定部及びテロップ出現検出部の処理方法を示すフローチャートである。
【図19】同じく、本発明の具体例に係る文字情報検出方法を示す図であって、輝度ヒストグラムからフレーム変化を検出する方法を示すブローチャートである。
【図20】同じく、本発明の具体例に係る文字情報検出方法を示す図であって、既検出テロップ候補がテロップか否かを推定する方法を示すブローチャートである。
【図21】(a)乃至(d)は、見出しとなる文字情報を含む画像の例を示す模式図である。
【図22】見出しの有効期間を説明する模式図である。
【図23】有効期間が切れた見出しを示す模式図である。
【符号の説明】
1 画像表示システム、10 画像表示装置、20 特徴抽出部、21 アニメーション抽出部、22 文字抽出部、23 人工画像検出部、24 アンカーショット検出部、25 文字特徴抽出部、26 背景特徴抽出部、30 レベル判定部、40 更新判定部、50 表示装置制御部、60 メモリ、70,801〜80N 表示装置、210 判定部、220 テロップ出現判定部、221候補フレーム画像検出部、222 局所変化検出部、230 エッジ密度検出部、240 記憶部、250 推定部、251 類似度検出部、252 継続カウンタ、253 安定度判定部、260 テロップ類似度検出部、270 提示画像生成部、280 ヒストグラム生成部、281,284 ブロック分割部、282,285 ヒストグラム計算部
Claims (11)
- 時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示装置において、
上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、
上記表示候補画像の特徴を抽出する特徴抽出手段と、
上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルと、
上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、
分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定手段と、
1以上の表示手段に接続され、上記表示画像判定手段により表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示するよう制御する表示制御手段とを有する
画像表示装置。 - 上記分類手段は、上記表示候補画像の特徴と、上記階層テーブルの各階層の特徴との類似度を比較し、該類似度が所定の閾値以上となる階層のうち最も類似度が大きい階層に上記表示候補画像を分類する
請求項1記載の画像表示装置。 - 上記表示画像判定手段により表示すると判定された上記表示用画像又は該表示用画像から切り出した文字領域を上記階層毎に記憶する画像記憶手段を有し、
上記表示画像判定手段は、上記階層毎に記憶された上記表示用画像又は上記文字領域の内、現時点において有効となっている期間に対応する上記表示用画像又は上記文字領域を表示する判定を行う
請求項1記載の画像表示装置。 - 上記複数の階層における上位レベルの階層の期間内に下位レベルの階層の期間が包含され、上記表示画像判定手段は、上記表示候補画像の階層のレベルが、上記画像記憶手段に記憶されている過去に抽出された表示用画像の階層のレベル以上である場合、該表示候補画像を表示すると判定する
請求項3記載の画像表示装置。 - 上記表示画像判定手段により表示すると判定された表示用画像の階層レベルが、上記画像記憶手段に記憶されている過去に抽出された表示用画像の階層レベルと同一である場合、過去に抽出された表示用画像を新たに判定された表示用画像に書き換える更新手段を有する
請求項4記載の画像表示装置。 - 上記更新手段は、上記新たに判定された表示用画像の階層のレベルが、上記過去に抽出された表示用画像の階層のレベル以上である場合、上記過去に抽出された表示用画像を消去する
ことを特徴とする請求項5記載の画像表示装置。 - 上記特徴抽出手段は、上記表示候補画像に含まれる文字の特徴を抽出する文字特徴抽出手段、上記表示候補画像が人工画像であるか否かを検出する人工画像検出手段、上記表示候補画像の中央位置に人物が存在するか否かを検出するバストショット検出手段、上記表示候補画像にアニメーションがあるか否かを検出するアニメーション検出手段、及び上記表示候補画像の入力時刻を検出する時刻検出手段のうち少なくとも1つを有する
請求項1記載の画像表示装置。 - 時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示方法において、
上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出工程と、
上記表示候補画像の特徴を抽出する特徴抽出工程と、
上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルを使用し、該階層テーブルに記憶された各階層の特徴と上記特徴抽出工程にて抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類工程と、
分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定工程と、
上記表示画像判定工程にて表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を1以上の表示手段にて表示するよう制御する表示制御工程とを有する
画像表示方法。 - 時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する動作をコンピュータに実行させるためのプログラムにおいて、
上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出工程と、
上記表示候補画像の特徴を抽出する特徴抽出工程と、
上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルを使用し、該階層テーブルに記憶された各階層の特徴と上記特徴抽出工程にて抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類工程と、
分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定工程と、
上記表示画像判定工程にて表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を1以上の表示手段にて表示するよう制御する表示制御工程とを有する
プログラム。 - 時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する動作をコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体において、
上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出工程と、
上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルを使用し、該階層テーブルに記憶された各階層の特徴と上記特徴抽出工程にて抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類工程と、
分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定工程と、
上記表示画像判定工程にて表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を1以上の表示手段にて表示するよう制御する表示制御工程とを有する
プログラムが記録された記録媒体。 - 時系列の画像からなる映像から、所定の画像の少なくとも一部を抽出して表示する画像表示システムにおいて、
1以上の表示装置と、
上記表示装置に上記所定の画像の少なくとも一部を供給する画像表示装置とを有し、
上記画像表示装置は、上記映像から文字情報を含む画像を表示候補画像として抽出する画像抽出手段と、上記表示候補画像の特徴を抽出する特徴抽出手段と、上記映像の時系列構造に応じて複数の期間が階層的に設けられ、上記複数の階層毎に予め設定された期間の区切りを示す見出しとなる文字情報を含む見出し画像の各階層毎の特徴が記憶された階層テーブルと、上記階層テーブルに記憶された各階層の特徴と上記特徴抽出手段により抽出された特徴との類似度から上記表示候補画像を上記複数の階層のうちいずれかに分類する分類手段と、分類された階層のレベルに応じて上記表示候補画像の上記期間を推定して現時点において有効となっている期間に対応する表示候補画像を表示すると判定する表示画像判定手段と、1以上の表示手段に接続され、上記表示画像判定手段により表示すると判定された表示用画像の階層毎に該表示用画像又はこれに含まれる文字情報を表示するよう制御する表示制御手段とを具備する
画像表示システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002230379A JP4158449B2 (ja) | 2002-08-07 | 2002-08-07 | 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002230379A JP4158449B2 (ja) | 2002-08-07 | 2002-08-07 | 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004072504A JP2004072504A (ja) | 2004-03-04 |
JP2004072504A5 JP2004072504A5 (ja) | 2005-10-27 |
JP4158449B2 true JP4158449B2 (ja) | 2008-10-01 |
Family
ID=32016473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002230379A Expired - Fee Related JP4158449B2 (ja) | 2002-08-07 | 2002-08-07 | 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4158449B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008130050A (ja) | 2006-11-24 | 2008-06-05 | Canon Inc | 画像検索装置及びその方法 |
JP2008166988A (ja) | 2006-12-27 | 2008-07-17 | Sony Corp | 情報処理装置および方法、並びにプログラム |
WO2010073905A1 (ja) * | 2008-12-25 | 2010-07-01 | シャープ株式会社 | 動画像視聴装置 |
CN102289479A (zh) * | 2011-08-01 | 2011-12-21 | 百度在线网络技术(北京)有限公司 | 一种确定图像展现方式并展现图像的方法、装置和设备 |
CN110781345B (zh) * | 2019-10-31 | 2022-12-27 | 北京达佳互联信息技术有限公司 | 视频描述生成模型的获取方法、视频描述生成方法及装置 |
-
2002
- 2002-08-07 JP JP2002230379A patent/JP4158449B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004072504A (ja) | 2004-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101318459B1 (ko) | 수신기 상에서 오디오비주얼 문서를 시청하는 방법 및이러한 문서를 시청하기 위한 수신기 | |
JP2000106661A (ja) | 画像処理方法及びシステム並びに装置 | |
US8421819B2 (en) | Pillarboxing correction | |
KR101414669B1 (ko) | 적응형 비디오 표현을 위한 방법 및 디바이스 | |
EP1045316A2 (en) | Image processing method and apparatus | |
US20070291134A1 (en) | Image editing method and apparatus | |
US20110299832A1 (en) | Adaptive video zoom | |
CN102246440B (zh) | 用于处理视频帧的方法和设备 | |
US20080232697A1 (en) | Image presentation system and operating method thereof | |
KR20040077708A (ko) | 멀티미디어 콘텐트를 링크하기 위한 다-양식 스토리세그먼트화 방법 및 장치 | |
EP1482731A2 (en) | Broadcast program contents menu creation apparatus and method | |
KR101652261B1 (ko) | 카메라를 이용한 오브젝트 검출 방법 | |
CN112752151B (zh) | 一种动态广告植入位置的检测方法及装置 | |
JPH0993588A (ja) | 動画像処理方法 | |
KR100681017B1 (ko) | 동영상의 요약 제공이 가능한 이동통신 단말기 및 이를 이용한 요약 제공 방법 | |
JP5360979B2 (ja) | 重要情報抽出方法および装置 | |
CN116308530A (zh) | 一种广告植入方法、装置、设备和可读存储介质 | |
JP4158449B2 (ja) | 画像表示装置、画像表示方法、プログラム、及び記録媒体、並びに画像表示システム | |
JP4244584B2 (ja) | 重要画像検出装置、重要画像検出方法、プログラム及び記録媒体並びに重要画像検出システム | |
Fearghail et al. | Director’s cut-analysis of VR film cuts for interactive storytelling | |
JP2000350165A (ja) | 動画像記録再生装置 | |
US20010001020A1 (en) | Image data processing method and apparatus and storage medium | |
JP2004080156A (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体並びに画像処理システム | |
JP4185790B2 (ja) | テレビジョン放送受信機 | |
US20040246259A1 (en) | Music program contents menu creation apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050727 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080624 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080707 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130725 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |