JPWO2006009105A1 - 映像処理装置およびその方法 - Google Patents

映像処理装置およびその方法 Download PDF

Info

Publication number
JPWO2006009105A1
JPWO2006009105A1 JP2006529179A JP2006529179A JPWO2006009105A1 JP WO2006009105 A1 JPWO2006009105 A1 JP WO2006009105A1 JP 2006529179 A JP2006529179 A JP 2006529179A JP 2006529179 A JP2006529179 A JP 2006529179A JP WO2006009105 A1 JPWO2006009105 A1 JP WO2006009105A1
Authority
JP
Japan
Prior art keywords
character
pixel
color difference
value
luminance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006529179A
Other languages
English (en)
Other versions
JP4667381B2 (ja
Inventor
毅 吉井
毅 吉井
谷川 裕二
裕二 谷川
岡田 真三弘
真三弘 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2006009105A1 publication Critical patent/JPWO2006009105A1/ja
Application granted granted Critical
Publication of JP4667381B2 publication Critical patent/JP4667381B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Character Input (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)
  • Studio Circuits (AREA)
  • Transforming Electric Information Into Light Information (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)

Abstract

入力される映像ストリーム(Svc)に組み込まれた文字情報(Ic)に選択的に処理を施す映像処理方法において、映像ストリーム(Svc)をフレーム単位で輝度情報(VY)を示す輝度フレーム(Y)と、色差情報(VCb、VCr)を示す複数の色差フレーム(Cb、Cr)とに分離され、輝度情報(VY)および輝度情報(Vcb、VCr)の少なくとも何れかに基づいて組み込まれた文字情報(Ic)を認識され、認識された文字情報(Ic)に対して消去、移動、および拡倍の少なくとも何れかの処理が施される。

Description

本発明は、例えばテレビジョン放送における緊急ニュースなどの映像ストリームに含まれる字幕に代表される文字情報を、抽出或いは加工する映像処理装置およびその方法に関する。
通常のテレビジョン放送において放送されている番組の録画中に、緊急ニュースなどの文字情報が放送中の番組の画面中に付加されて放送されることがある。このような場合、ユーザは番組の録画を欲しているが、基本的に緊急ニュース自体の録画は望まない。つまり、映像ストリームに含まれる緊急放送などの文字情報は、リアルタイムで視聴する場合は意味を持つが、録画したストリームを視聴する場合(即ち時間が経過した場合)には文字情報が必要でない場合が多い。また、映像ストリームを集中して視聴したい視聴者にとっては、文字情報は快適な視聴の妨げとなる。
そのために、放送されている番組に付加されている文字情報を消去する技術が従来提案されている。そのような技術の例として、放送側で、本来の映像信号とは別に補間信号を入力して映像ストリームを生成しておき、必要に応じて、受信側で映像ストリームから映像信号のみを再生する技術が提案されている(特許技術文献1)。
特開平9−200684号公報
しかしながら、上述の方法においては、映像ストリームとは別に補間信号を挿入して、映像ストリームを作成しておくために、放送の前に、補間信号を用意しておかなければならず、緊急時に即応してニュースを放送するという目的を実質上果たすことができない。それゆえに、緊急時にも直ちに、放送中の番組に文字情報を付加できると共に、必要に応じて付加した番組の画面から文字情報を消去できると言う相反する要望を満たす映像処理方法が必要とされている。
よって、本発明は、放送側で映像信号とは別に補間信号を用意して映像ストリームを生成する必要が無く、受信側で文字放送が付加された映像ストリームから文字情報を精度良く抽出し、消去や移動といった必要な加工を施し、視聴者が望むような映像ストリームを生成できる映像処理方法およびその装置を提供することを目的とする。
本発明は、入力される映像ストリームに組み込まれた文字情報に選択的に処理を施す映像処理方法であって、
前記映像ストリームをフレーム単位で輝度情報を示す輝度フレームと、色差情報を示す複数の色差フレームとに分離する映像ストリーム分離ステップと、
前記輝度情報および前記輝度情報の少なくとも何れかに基づいて、前記組み込まれた文字情報を認識する文字認識ステップと、
前記認識された文字情報に対して、消去、移動、および拡倍の少なくとも何れかの処理を施す文字加工ステップとを備える。
本発明に係る映像処理方法は、例えば緊急ニュースなどの文字情報が含まれる映像ストリームから、文字情報を加工した映像ストリームを生成できる。例えば、DVDレコーダなどの録画機を用いて録画したテレビ番組に文字情報が含まれていた場合、この再生に本発明を適用することによって、文字情報を消去した映像ストリームを再生でき、視聴者の要望にあった快適な視聴環境を提供できる。
図1は、本発明の実施の形態に係る映像処理装置の構成を示すブロック図である。 図2は、図1に示した映像処理装置において処理対象である映像ストリームのフレーム画像の一例を表す図である。 図3は、図1に示した映像処理装置の主な文字認識動作を表すフローチャートである。 図4は、図3に示した検索範囲指定サブルーチンにおける検索範囲指定の説明図である。 図5は、図3に示した検索範囲指定サブルーチンにおける動作を表すフローチャートである。 図6は、図3に示した高輝度値画素検索サブルーチンにおける高輝度検索の説明図である。 図7は、図3に示した文字認識サブルーチンにおける動作を表すフローチャートである。 図8は、図3に示した同一色検索サブルーチンにおける同一色検索の説明図である。 図9は、図3に示した同一色検索サブルーチン動作を表すフローチャートである。 図10は、図3に示した文字表示領域認識サブルーチンにおける文字表示領域認識の説明図である。 図11は、図3に示した文字表示領域認識サブルーチンにおける動作を表すフローチャートである。 図12は、図3に示した文字線幅認識サブルーチンにおける文字線幅認識の説明図である。 図13は、図3に示した文字線幅認識サブルーチンにおける動作を表すフローチャートである。 図14は、図3に示した文字縁取り認識サブルーチンにおける文字縁取り認識の説明図である。 図15は、図3に示した文字縁取り認識サブルーチンにおける動作を表すフローチャートである。 図16は、図3に示した点滅表示認識サブルーチンにおける点滅表示認識の説明図である。 図17は、図3に示した点滅表示認識サブルーチンにおける動作を表すフローチャートである。 図18は、図3に示した移動表示認識サブルーチンにおける移動表示認識の説明図である。 図19は、図3に示した移動表示認識サブルーチンにおける動作を表すフローチャートである。 図20は、図1に示した映像処理装置の主な文字加工動作を表すフローチャートである。 図21は、図20に示した文字情報消去サブルーチンにおける文字消去の説明図である。 図22は、図20に示した文字情報消去サブルーチンにおける動作を表すフローチャートである。 図23は、図20に示した文字情報移動サブルーチンにおける動作を表すフローチャートである。 図24は、図20に示した文字情報拡倍サブルーチンにおける動作を表すフローチャートである。 図25は、図20に示した注目領域回避サブルーチンにおける動作を表すフローチャートである。 図26は、本発明の実施の形態に係る映像処理装置における記録装置の構造を示すブロック図である。 図27は、本発明の実施の形態に係る映像処理装置における再生表示装置の構造を示すブロック図である。
符号の説明
Avp 映像処理装置
Ar 記録装置
Ap 再生装置
002 前処理器
003 入力用メモリ
004 出力用メモリ
005 輝度フレームメモリ
006 色差Cbフレームメモリ
007 色差Crフレームメモリ
008 被処理輝度フレームメモリ
009 被処理色差Cbフレームメモリ
010 被処理色差Crフレームメモリ
011 文字認識器
012 文字加工器
013 文字表示画素テーブル記憶メモリ
014 文字表示フレームテーブル記憶メモリ
015 後処理器
016 エンコーダ
017 記録部
018 記録コントローラ
019 記録媒体
020 再生部
021 表示部
022 再生コントローラ
030 システムコントローラ
040 メモリ
先ず、図1を参照して、本発明に係る映像処理装置について説明する。映像処理装置Avpは、前処理器002、入力用メモリ003、文字認識器011、文字加工器012、文字表示画素テーブル記憶メモリ013、文字表示フレームテーブル記憶メモリ014、出力用メモリ004、および後処理器015を含む。映像処理装置Avpは、さらに、全体の動作を制御するシステムコントローラ030および、制御に必要なデータを記憶するメモリ40を含む。
前処理器002は、外部から入力される元々のストリームSv(図示せず)に、文字情報Ic(図2)が組み込まれた映像ストリームSvcを、フレーム毎に、輝度信号Y、色差Cb信号、および色差Crに分離して、入力用メモリ003に出力する。なお、輝度信号Y、色差Cb信号、および色差Crは、それぞれ、図面においては、Y、Cb、およびCrと表示されている。また、輝度信号Y、色差Cb信号、および色差Cr信号をフレーム信号と総称する。
入力用メモリ003は、映像処理装置Avpが映像ストリーム中のある任意のNフレーム目のフレーム信号に対して処理を行う際に、Nフレーム目の前後のある一定時間幅の映像ストリーム量を格納できる容量を持つ記憶領域である。なお、入力用メモリ003は、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007を含む。前処理器002よって分離された、輝度信号Y、色差Cb信号、および色差Cr信号はそれぞれ、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007に格納される。
文字認識器011は、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007のそれぞれから供給される輝度信号Y、色差Cb信号、および色差Cr信号に文字情報Icが含まれるかどうかを判定する。文字認識器011は、さらに、フレーム内のどの画素が文字情報Icを示す文字画素かを認識して、文字画素の座標位置を表す文字画素座標情報Cpを生成して、文字表示画素テーブル記憶メモリ013に出力する。本明細書においては、説明の便宜上、映像ストリームが表す画面画像を構成する画素を画素Pと呼び、画面画素において文字情報Icを表す画素を文字画素Pcと呼んでそれぞれを識別する。
画面画像は、ラスタスキャンの順番に配置された無数の画素で構成される。そして画素のそれぞれは、水平方向の位置と垂直方向の位置のそれぞれに対応する座標(x,y)によって識別される。つまり、画素Pおよび文字画素Pcのそれぞれを識別する場合には、画素P(x,y)および文字画素Pc(x,y)と表現される。本明細書においては、必要に応じて、個々の画素Pおよび文字画素Pcを、それぞれ画素P(x,y)および文字画素Pc(x,y)と識別するものとする。
文字表示画素テーブル記憶メモリ013はさらに、文字情報Icを表すと認識された(輝度信号Y、色差Cb信号、色差Cr信号の少なくとも何れかと)画素Pを、文字画素Pcとして表す文字画素座標情報Cpを生成して、文字表示画素テーブル記憶メモリ013に出力する。文字画素座標情報Cpは文字画素Pcを特定する、いわば画面画像における文字画素Pcの座標(x,y)を表すデータである。つまり、文字画素Pc(x,y)のデータが文字表示画素テーブル記憶メモリ013において、テーブル状に記録されることより、文字画素座標情報Cpを文字表示画素テーブルと呼ぶことができる。
文字表示フレームテーブル記憶メモリ014は、文字画素座標情報Cpに基づいて、文字情報Icが発見されたフレームを登録する。文字フレーム情報Fcはフレームテーブルを構成するデータであり、この意味において文字フレーム情報Fcを文字表示フレームテーブルと呼ぶことができる。なお、文字フレーム情報Fcは、フレーム番号などの通常フレームの識別に用いられているもので良い。文字認識器011は、文字認識処理後に、輝度信号Y、色差Cb信号、および色差Cr信号を文字加工器012に出力する。なお、後ほど、図2〜図19を参照して、文字認識器011について詳述する。
文字表示画素テーブル記憶メモリ013は、文字画素座標Cpを文字加工器012に供給する。同様に、文字表示フレームテーブル記憶メモリ014は、文字画素Pcを文字加工器012に供給する。文字表示画素テーブル記憶メモリ013は、文字画素座標Cpおよび文字フレーム情報Fcに基づいて、文字認識器011から入力された輝度信号Y、色差Cb信号、および色差Cr信号に含まれる文字情報成分に対して、移動、各倍、および消去に代表される加工処理を施した後に出力用メモリ004に出力する。この加工処理が施された、輝度信号Y、色差Cb信号、および色差Cr信号をそれぞれ、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTと識別する。図面においては、それぞれ、YT、CbT、およびCrTと表示されている。なお、文字表示画素テーブル記憶メモリ013については、後ほど図20〜図25を参照して詳述する。
出力用メモリ004は、被処理輝度フレームメモリ008、被処理色差Cbフレームメモリ009、および被処理色差Crフレームメモリ010を含む(図面では、それぞれ、Yフレームメモリ、Cbフレームメモリ、Crフレームメモリと表示)。なお、出力用メモリ004は、入力用メモリ003と同様に、Nフレーム目の前後の一定時間幅の映像ストリーム量を格納できる容量を持つ記憶領域である。輝度フレームメモリ005、色差Cbフレームメモリ006、および被処理色差Crフレームメモリ010には、それぞれ、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが一時的に格納される。
出力用メモリ004は所定時間だけ、被処理輝度信号YT、色差Cb信号、および色差Cr信号を保持した後に後処理器015に出力する。後処理器015は、被処理輝度信号YT、被処理色差CbT信号、および被処理色差CrT信号をY/C合成して映像ストリームSvtを生成して出力する。なお、映像ストリームSvYは、映像ストリームSvcに含まれている文字情報Icが処理を受けている点を除いては、基本的に映像ストリームSvcと同一である。このようにして、映像処理装置Avpに対して、文字情報Icを含む映像ストリームSvcが入力されると、文字情報Icに対して、移動や各倍や消去などの加工が施された映像ストリームSvtが生成されて出力される。
次に、図2〜図19を参照して、文字認識器011について説明する。図2に、映像ストリームSvcの表す任意のNフレーム目の画面画像Iの一例を示す。なお、画面画像Iは、H×V個の画素P(x,y)で構成される。なお、HおよびVはそれぞれ、規格ごとに定められている所定の整数値である。なお、xは水平(H)方向の位置を示し、yは垂直方向の位置を示す。
同例においては、画面画像Iの大部分は、地面Eと建物Bと空Sとで構成されている。そして、画面画像Iの上部の空Sの部分に「ABCDEFGHI」が表示されている。つまり、この「ABCDEFGHI」が映像ストリームSvに組み込まれた文字情報Icであり、文字情報Ic以外の画像が元の映像ストリームSvである。つまり、文字認識器011は、映像ストリームSvcの各フレームに含まれる「ABCDEFGHI」(文字情報Ic)を認識する。本例においては、「ABCDEFGHI」を表す画素Pが文字画素Pcである。
図3に、文字認識器011の文字認識動作を表すフローチャートを示す。文字認識器011による文字認識は、検索範囲指定サブルーチン#100、高輝度値画素検索サブルーチン#200、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字線幅認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800を含む。
前処理器002によってY/C分離された映像ストリームSvcのフレーム信号である、輝度信号Y、色差Cb信号、および色差Cr信号が文字認識器011に入力された時点で、文字認識動作が開始される。
まず、検索範囲指定サブルーチン#100において、画面上における文字情報Icの検索範囲が予め指定される。一般的に、緊急ニュースなどの文字情報Icは画面の上下左右の端部に表示されることが多い。よって、画面画像Iにおいて、文字情報Icを探索する対象範囲である探索範囲Rsを任意の範囲に限定しておくことで、文字情報Icの誤検出の低減を図る。図2に例示する画面画像Iでは、文字情報Icは画面の上部に表示されているので、探索範囲Rsは画面の上部に設定される。
次に、図4を参照して、映像ストリームSvcに、後から組み込まれた文字情報Icとは別に、元の映像ストリームにも文字情報が含まれている場合の探索範囲Rsについて説明する。図4に示す画面画像Iは、図3に示した画面画像Iと類似しているが、画像の中央部の空Sの部分にも、表示されている建物Bの説明として「1970年 建 築」との文字が表示されている。この「1970年 建 築」は、画像の説明のためのキャプションCsであって、映像ストリームSvに組み込まれた文字情報Icではない。同図に示すように、画像の説明のためにキャプションCsは、文字情報Icとは異なる場所に表示されることが多い。なお、図2および図4に示す例では、文字情報Icは画面の上部に表示されているが、映画の字幕などの場合は、画像の下部に表示されることが多い。何れにしても、映像ストリームSvに後から組み込まれる文字情報Icは、画面画像Iにおいて、画像作成者の意図をできるだけ損なわないような部分に表示されることが多い。
このように、文字情報IcとキャプションCsが混在する可能性があり、さらに文字情報Icの存在する場所の特定が困難な場合には、探索範囲Rsを指定する変わりに、文字情報Icが存在し得ない領域を非探索範囲Rscとして指定する。結果、探索範囲Rsを指定する場合に比べては劣るもの、文字認識処理の負荷を低減すると共に、文字情報Icの誤検出の確率を防止あるいは、誤検出を防止できる。つまり、探索範囲Rsあるいは非探索範囲Rscの指定を行わなくとも、処理負荷が増大および文字情報Icの誤検出の確率の増大を除けば、本サブルーチンの有無は文字認識処理に影響を与えない。
図5を参照して、検索範囲指定サブルーチン#100における動作の詳細について説明する。検索範囲指定サブルーチン#100においては、先ず
ステップS102において、ユーザに対して、入力される映像ストリームSvcに対して、文字画素Pcを探す範囲である探索範囲Rs又は、文字画素Pcを探さない非探索範囲Rscの何れかを設定するか否かが問い合わされる。この問い合わせは、テレビなどの映像ストリームSvcの画像を表示するモニタ(図示せず)に、メッセージを表示するようにしても良いし、音声で行っても良い。この問い合わせに対して、ユーザはリモコンやマウスなどの入力手段を用いて、Yes或いはNoの回答を入力する。ユーザがYesを入力した場合、制御は次のステップS104に進む。
ステップS104においては、ユーザは探索範囲Rs又は非探索範囲Rscを指定する。好ましくは、ユーザは、上述のモニタに表示される映像ストリームSvcの画面画像Iに対して、マウスなどの入力手段を用いて、探索範囲Rs或いは非探索範囲Rscを指定する。なお、指定された探索範囲Rs或いは非探索範囲Rscは、画像を構成する画素Pの座標(x,y)の集合を表す情報として、文字認識器011に入力される。そして、検索範囲指定サブルーチン#100が終了する。なお、ステップS102において、ユーザがNoを回答した場合には、制御は上述のステップS104をスキップして、検索範囲指定サブルーチン#100が終了する。
次に、図6を参照して、高輝度値画素検索サブルーチン#200における動作について説明する。高輝度値画素検索サブルーチン#200は、緊急ニュースなどの文字情報Icは、一般的に、画面上に高輝度で表示される特徴に基づいて、文字情報Icを表示する画素を抽出する。図6に、入力用輝度Yフレームメモリ005に格納されている輝度信号Yであって、図4の画像における文字情報Icの「A」を含む部分の輝度画面画像IYを部分的に拡大して示すと共に、同輝度画面画像IYの水平方向のラインLn上の輝度分布DYを示している。なお、輝度画面画像IYは、H×V個の輝度画素PY(x,y)で構成される。図6において、一つ一つの升目が、輝度画素PY(x,y)を示している。なお、輝度画素PY(x,y)も特に個々を識別する必要のない場合には、単に輝度画素PYと呼ぶ。
また、輝度分布DYにおいて、縦軸はラインLn上の輝度画素PY(x,y)の輝度値VYを示し、横軸はラインLn上の輝度画素PY(x,y)を示している。なお、説明の便宜上、必要に応じて、輝度画面画像IYにおいて、文字情報Icを表示する輝度画素PYを文字輝度画素PYcと呼び、ストリームSvを表示する画素をストリーム輝度画素PYsと呼び、それぞれを識別する。同様に、文字輝度画素PYcおよびストリーム輝度画素PYsの輝度値VYをそれぞれ、文字輝度値VYcおよびストリーム輝度値VYsと識別する。
本例においては、ラインLnは文字情報Icの「A」の上部を横切っている。このように、輝度画面画像IYにおいて、文字情報Icの文字を構成する文字輝度画素PYcの文字輝度値VYcは、映像ストリームSvを表示しているストリーム輝度画素PYsのストリーム輝度値VYsより大きい。よって、本発明においては、文字輝度値VYcとストリーム輝度値VYsを峻別する輝度閾値Vthを予め設定しておき、輝度閾値Vthより大きな輝度値VYを有する輝度画素PYを文字輝度値PYcとして抽出する。なお、このような輝度画面画像IYを構成する個々の輝度画素PY(x,y)の輝度値VYを、予定の輝度閾値Vthと比較するには、好ましくは、ラスタスキャンの順番に行われる。
つまり、高輝度値画素検索サブルーチン#200においては、上述の文字輝度値PYcの抽出処理が、検索範囲指定サブルーチン#100で定められた検索範囲内の全ての画素Pに対して施される。文字情報Icであるとして抽出された文字輝度画素PYcの座標(x,y)を表す文字画素座標情報Cpが生成される。そして、文字表示画素テーブル記憶メモリ013は、文字画素座標情報Cpに基づいて、抽出された文字輝度画素PYcの座標(x,y)を登録する。また、文字輝度画素PYcが抽出されたフレームを表す文字フレーム情報Fcが生成される。文字表示フレームテーブル記憶メモリ014は、文字フレーム情報Fcに基づいて、文字輝度画素PYcが抽出されたフレームを登録する。言い換えれば、文字画素座標情報Cpは文字表示画素テーブル記憶メモリ013に格納され、文字フレーム情報Fcは文字表示フレームテーブル記憶メモリ014に格納される。
次に、図7を参照して、上述の高輝度値画素検索サブルーチン#200における動作を詳細に説明する。高輝度値画素検索サブルーチン#200が開始すると、先ず、
ステップS202において、上述の輝度閾値Vthが設定される。好ましくは、ユーザがリモコンなどの入力手段を用いて、適切な値を入力する。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、予め決めておいた輝度閾値Vthを格納しておく手段から、供給されるように構成しても良い(図1)。そして、制御は次のステップS204に進む。
ステップS204において、映像ストリームSvcの輝度信号Yの全ての輝度画素PY(x,y)に対して、文字輝度画素PYcであるかを判別する文字輝度画素検出処理を施す順番が決定されると共に、決定された順番に処理を施す輝度画素PY(x,y)が1つずつ選択される。好ましくは、選択された輝度画素PY(x,y)毎に、文字輝度画素検出処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象を更新する。そして、制御は次のステップS206に進む。
ステップS206において、輝度画素PY(x,y)の座標値(x,y)を、上述のステップS104において指定された探索範囲Rs或いは非探索範囲Rscを表す座標値(x,y)と比較して、輝度画素PYが探索範囲Rs内或いは非探索範囲Rsc内であるか否かが判断される。Yesの場合、制御は次のステップS208に進む。
ステップS208において、輝度画素PY(x,y)の輝度値VYが輝度閾値Vthより大きいか否かが判断される。Yes、つまり輝度画素PY(x,y)が文字輝度画素PYcであると判断される場合、制御は次のステップS210に進む。
ステップS210において、文字輝度画素PYcであると判断された輝度画素PY(x,y)の座標(x,y)に基づいて、文字画素座標情報Cpが生成される。そして、制御は次のステップS212に進む。
ステップS212において、文字輝度画素PYcと判断された輝度画素PY(x,y)が含まれるフレームの識別子に基づいて、文字フレーム情報Fcが生成される。そして、制御は次のステップS214に進む。
なお、上述のステップS206およびステップS208においてNoと判断される場合は、制御は、ステップS208、S210、およびS212の処理をスキップして、直接ステップS214に進む。
ステップS214において、ステップS204において、検索対象として設定された全ての輝度画素PY(x,y)のうちで、検索がされていないものが残っているか否かが判断される。具体的には、現在の検索対象の輝度画素PYのx、y座標の値が、ステップS204で設定された最大値より小さいか否かが判断される。Yesの場合、制御はステップS204に戻って、次のラスタスキャン順位にある輝度画素PYが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。
ステップS214でYes、つまり、現フレームの輝度信号Yに対して文字輝度画素PYcの認識が完了した時点で、制御は次のステップS216に進む。
ステップS216において、ステップS210およびステップS212において、全輝度画素PYに関して生成された、認識された文字輝度画素PYcを表す文字画素座標情報Cpおよび文字フレーム情報Fcがそれぞれ文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014に記録される。すなわち、文字輝度画素PYcが文字表示画素テーブル記憶メモリ013に登録され、そのフレームが文字表示フレームテーブル記憶メモリ014に登録される。そして、高輝度値画素検索サブルーチン#200を終了して、制御は同一色検索サブルーチン#300に進む。
なお、上述のように、フレームの全ての輝度画素PYに対する文字輝度画素検出処理の完了後に、文字画素座標情報Cpおよび文字フレーム情報Fcを完成させて登録するのではなく、文字輝度画素PYcが検出される毎に、文字画素座標情報Cpおよび文字フレーム情報Fcとして文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014に登録しても良い。
同一色検索サブルーチン#300は、一般的に緊急ニュースなどの文字情報Icは同一色で表示される特徴に基づいて、高輝度値画素検索サブルーチン#200における輝度閾値Vthに基づいて検出した文字輝度画素PYcに対して、同一色(色差の程度)というフィルタを適用して、文字情報Icの認識精度を上げるものである。なお、本発明においては、同一色であるか否かは、色差Cb信号および色差Cr信号の何れに基づいても同様に、判断される。よって、冗長をさけるために、本明細書においては、色差Cb信号に基づく説明をもって、色差Cr信号に基づく説明を省略する。
図8を参照して、同一色検索サブルーチン#300に処理について、具体的に説明する。図8は、色差Cbフレームメモリ006に格納されている色差Cb信号であって、図4の画像における文字情報Icの「A」を含む部分の色差Cb画面画像Icbを拡大して示すと共に、色差Cb画面画像Icbの水平方向のラインLn上の色差Cb分布Dcbを示している。
色差Cb画面画像Icbは、基づく信号が色差Cb信号である点を除いて、上述の輝度画面画像IYと同様に構成されている。つまり、色差Cb画面画像Icbにおいて、一つ一つの升目が、色差Cb画面画像Icbの色差Cb画素Pcb(x,y)を示している。xおよびyは、それぞれ色差Cb画面画像Icbにおける水平方向の座標、および垂直方向の座標を示す。
また、色差Cb分布Dcbにおいて、縦軸はラインLn上の色差Cb画素Pcb(x,y)の色差Cb値Vcbを示し、横軸はラインLn上の色差Cb画素Pcb(x,y)を示している。なお、説明の便宜上、必要に応じて、文字情報Icを表示する色差Cb画素を色差Cb文字画素PcbCと呼び、ストリームSvを表示する色差Cb画素を色差Cbストリーム画素PcbSと呼び、それぞれを識別すると共に、両者を色差Cb画素PCbと総称する。同様に、色差Cb文字画素PcbCおよび色差Cbストリーム画素PCbSの色差値Vcbをそれぞれ、文字色差Cb値VcbCおよびストリーム色差Cb値VcbSと識別する。
本例においては、ラインLnは文字情報Icの「A」の上部を横切っている。文字情報Icが同一色で表示されているとすれば、ステップ#200で登録された文字輝度画素PYcに対応する色差Cb画素Pcbの色差Cb値VcbCの平均値は、文字表示色とほぼ同様の値を持つ。よって、文字の表示色は、高輝度値画素検索サブルーチン#200で登録された、全ての色差Cb画素PcbのCb色差値Vcbの平均値±誤差αの範囲内に収まるはずであるので、この範囲外となった、色差Cb画素Pcb(x,y)に対応する文字輝度画素PYc(x,y)を文字表示画素テーブル記憶メモリ013から登録削除する。なお、αは任意の許容量であり、入力される映像ストリームSvcや映像処理装置Avpに関して、適切に決定される。このようにして、高輝度値画素検索サブルーチン#200による文字輝度画素PYcの検出に基づく、文字情報Icの認識精度の向上を図っている。しかしながら、本高輝度値画素検索サブルーチン#200の処理が、本発明における文字情報Ic認識に不可欠と言う訳ではない。
次に、図9を参照して、上述の同一色検索サブルーチン#300における動作について、色差Cbフレーム画像を例に詳細に説明する。なお、色差Crフレーム画像の場合も、色差Cbフレーム画像の場合と同様であるので、説明を省く。
同一色検索サブルーチン#300が開始すると、先ず、
ステップS302において、同一色検索を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「同一色検索を行うか」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、同一色検索を行うか否かを予め決めておいても良い。そして、制御は次のステップS304に進む。
ステップS304において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、色差Cb画面画像Icbにおいて、文字画素座標情報Cpに記録されている文字画素Pc輝度信号Y(x,y)に対応する色差Cb画素Pcb(x,y)が特定される。そして、制御は次のステップS306に進む。
ステップS306において、特定された全ての色差Cb画素Pcb(x,y)のCb色差値Vcbが検出される。そして、検出されたCb色差値Vcbの平均値である平均Cb色差値Vcb(mean)が算出される。そして、制御は次のステップS308に進む。
ステップS308において、上述の誤差αに基づいて、2つの同一色差Cb閾値Vcb1、およびVcb2が次式(1)および(2)に従って生成される。
Vcb1=Vcb(mean)−α ・・・・(1)
Vcb2=Vcb(mean)+α ・・・・(2)
そして、制御は次のステップS310に進む。
ステップS310において、ステップS304で特定された全ての色差Cb画素Pcbに対して、同一色であるかを判断する同一色判定処理を施す順番が決定されると共に、決定された順番に色差Cb画素Pcb(x,y)が1つずつ選択される。好ましくは、設定された色差Cb画素Pcb(x,y)毎に、同一色判定処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象が選択される。そして、制御は次のステップS312に進む。
ステップS312において、ステップS310で選択された色差Cb画素Pcb(x,y)のCb色差値Vcbが、同一色差Cb閾値Vcb1より大きく、且つ同一色差Cb閾値Vcb2より小さいか否かが判断される。No、つまり、当該色差Cb画素Pcb(x,y)は、文字情報Icを表す色差Cb文字画素PcbCではないと判断場合、制御は次のステップS314に進む。
ステップS314において、文字画素座標情報Cpが補正される。具体的には、文字画素座標情報CpからステップS312において、色差Cb文字画素PcbCではないと判断された色差Cb画素Pcb(x,y)に相当する文字輝度画素PYcの(x,y)座標が文字画素座標情報Cpから削除されるように、文字画素座標情報Cpが補正せれる。そして、制御は次のステップS316に進む。
ステップS316において、ステップS304において、検索対象として特定された全ての色差Cb画素Pcb(x,y)のうちで、検索がされていないものが残っているか否かが判断される。具体的には、現在の検索対象の色差Cb画素Pcbの(x,y)座標の値が、ステップS304で設定された最大値より小さいか否かが判断される。Yesの場合、制御はステップS312に戻って、次のラスタスキャン順位にある色差Cb画素Pcb(x,y)が選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。
ステップS316でYes、つまり、現フレームの色差Cb信号に対して同一色検索処理が完了した時点で、制御は次のステップS318に進む。
ステップS318において、ステップS316で補正された文字画素座標情報Cpに基づいて、必要であれば、文字フレーム情報Fcが補正される。具体的には、色差Cb文字画素PcbCではないと判断された色差Cb画素Pcb(x,y)に対応する文字輝度画素PYcの削除により、文字フレーム情報Fcに登録されているフレームに含まれる文字輝度画素PYcが文字画素座標情報Cpに登録されなくなった時に、当該フレームが文字フレーム情報Fcから登録削除される。そして、同一色検索サブルーチン#300の処理が終了する。
一方、上述のステップS302において、Noと判断される場合には、制御は上述のステップS302〜S318をスキップして、つまり同一色検索サブルーチン#300にお同一色判定処理を実行することなく、次の文字表示領域認識サブルーチン#400に進む。
また、ステップS312においてYes、つまり、色差Cb画素Pcb(x,y)は、色差Cb文字画素PcbCであると判断される場合、制御は文字画素座標情報Cpを補正するステップS314をスキップしてステップS316に進む。そして、ステップS318を経て、同一色検索サブルーチン#300の処理を終了して、制御は文字表示領域認識サブルーチン#400に進む。
文字表示領域認識サブルーチン#400は、一般的に緊急ニュースなどの文字情報Icは画面上である限定された領域に密集して表示される特徴に基づいて、さらに文字情報Icの認識精度の向上を図るものである。簡単に言えば、上述の処理において、文字画素Pcとして検出された画素Pの内で、他の文字画素Pcと相対的に離れた位置に存在する画素を抽出して、文字画素座標情報Cpから文字画素としての登録を削除するものである。なお、ここでいう文字画素Pcとは、高輝度値画素検索サブルーチン#200で登録された文字輝度画素PYcおよび、同一色検索サブルーチン#300で登録された色差Cb文字画素PcbCの何れであっても良い。
よって、今後、特に対象文字画素Pcの種類に限定する必要が内場合には、文字表示画素テーブル記憶メモリ013に登録されている文字情報Icを表す画素Pを、全て文字画素Pcと総称して説明する。つまり、本例においては、文字表示画素テーブル記憶メモリ013に登録されている文字輝度画素PYcおよび色差Cb文字画素PcbC(PcrC)を文字画素Pcと総称する。
図10を参照して、文字表示領域認識サブルーチン#400における処理の基本的な考え方について説明する。図10は、文字情報Icが「ABCDEFGHI」ではなく、「ABCDEFGHIJKLMN」と「OPQRSTUVWXYZ」とが2段に表示されていると共に、ノイズNが表示されている点を除いて、基本的に図2に例示した画面画像Iと同じである。なお、文字情報Icが表示されている範囲を、文字表示領域Ricと呼ぶ。このような画面画像Iにおいて、ノイズNの輝度値VYが輝度閾値Vth大きい場合(ステップS208でYes)、さらにCb色差値VcbおよびCr色差値Vcrが所定閾値内である場合(ステップS312でYes)の場合には、ノイズNは文字情報Icとして誤認識されてしまう。つまり、ノイズNを構成する画素Pは、文字画素Pcとして誤って文字表示画素テーブル記憶メモリ013、および/或いは文字表示フレームテーブル記憶メモリ014に登録されてしまう。文字表示領域認識サブルーチン#400では、このような誤認識を以下のようにして防止する。
ノイズNと文字情報Icとは、以下のようにして識別される。つまり、文字表示画素テーブル記憶メモリ013に登録されている全ての文字画素Pc(文字輝度画素PYc、色差Cb文字画素PcbC)の内の1つと、他の全ての文字画素Pcとの距離の総和“L”を算出する。このLを個々の文字画素Pcの他画素間総距離Lと呼ぶ。この他画素間総距離Lに基づいて、特定の文字画素Pcが文字表示領域Ricに対してどの程度離れた位置に表示されているかを判定する。次に、他画素間総距離Lの平均値である平均他画素間総距離L(mean)に比べて極端に大きな値の他画素間総距離Lを持つ文字画素Pcは、文字情報Icを表すものではないとして、文字表示画素テーブル記憶メモリ013に格納されている文字フレーム情報Fcから削除される。
次に、図11を参照して、文字表示領域認識サブルーチン#400における動作を詳細に説明する。文字表示領域認識サブルーチン#400が開始すると、先ず、
ステップS402において、文字表示領域認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字表示領域認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め文字表示領域認識を行うか否かを決めておいても良い。そして、制御は次のステップS404に進む。
ステップS404において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pc(x,y)が特定される。そして、制御は次の本ステップS406に進む。
ステップS406において、ステップS404で特定された全ての文字画素Pc(x,y)に対して、他画素間総距離Lを求める順番が決定されると共に、決定された順番に文字画素Pcを1つずつ選択される。そして、制御は次のステップS408に進む。
ステップS408において、ステップS406で選択された文字画素Pcに関して他r画素間総距離Lが算出される。そして、制御は次のステップS410に進む。
ステップS410において、ステップS404において、領域確認対象として特定された全ての文字画素Pcのうちで、他画素間総距離Lが算出されていないものが残っているか否かが判断される。Yesの場合、制御はステップS406に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、他画素間総距離Lが算出された時点で、制御は次のステップS412に進む。
ステップS412において、平均他画素間総距離L(mean)が算出される。そして、制御は次のステップS414に進む。
ステップS414において、ステップS406におけるのと同様に、他画素間総距離Lを平均他画素間総距離L(mean)と比較する文字画素Pcが選択される。そして、制御は次のステップS416に進む。
ステップS416において、他画素間総距離Lが平均他画素間総距離L(mean)より、所定距離γだけ小さいか否かが判断される。なお、γは、映像ストリームSVcの画質等によって適宜決められる距離である。No、つまり文字画素Pcは文字情報Icでは無いと判断される場合、制御は次のステップS418に進む。
ステップS418において、文字画素座標情報Cpが補正される。具体的には、文字画素座標情報CpからステップS416において、文字情報Icではないと判断された文字画素Pcの(x,y)座標が、文字画素座標情報Cpから削除される。そして、制御は次のステップS420に進む。
ステップS420において、ステップS410におけるのと同様に、ステップS414において、比較として選択される全ての文字画素Pcのうちで、平均他画素間総距離L(mean)との比較が行われていないものが残っているか否かが判断される。Yesの場合、制御はステップS414に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、平均他画素間総距離L(mean)との比較が行われた時点で、制御は次のステップS422に進む。
ステップS422において、ステップS418において補正されて文字画素座標情報Cpに基づいて、必要であれば、上述のステップS316におけるのと同様に文字フレーム情報Fcが補正される。そして、文字表示領域認識サブルーチン#400の処理が終了する。
次に、図12を参照して、文字線幅認識サブルーチン#500における処理の基本的な考え方について説明する。文字線幅認識サブルーチン#500は、一般的に文字は一定の文字線幅で描かれる特徴に基づいて、文字画素Pcの水平および垂直方向への出現の連続性から文字の線幅を抽出し、極端にかけ離れた連続値を持つ文字画素Pcを文字情報Icではないと判断して、文字画素座標情報Cpから登録削除することで、文字認識の精度のなおさらなる向上をはかるものである。
図12に、図4に示した画面画像Iにおける文字情報Icの「D」を含む限定領域Rcが拡大表示されていると共に、文字画素Pcの連続値分布Dcを示す。同図に示されるように文字はある一定の文字線幅Cwlで描画される。よって、水平または垂直方向への文字登録画素の連続値分布Dcは、文字線幅Cwlの値の付近に集中する。仮に連続値Cが文字線幅Cwlより大きい場合でも、文字は一文字一文字独立しているので、文字サイズ幅Cw以上となることはない。また、この文字サイズ幅Cwはフォントにもよるが、一般的に文字線幅Cwlの数倍〜数十倍程度である。よって、連続値Cが文字線幅Cwlより極端に大きな連続値Cを持つ文字画素Pcは文字情報Icでないと判断して、文字画素座標情報Cpから登録削除する。
図13に示すフローチャートを参照して、文字線幅認識サブルーチン#500における動作の詳細を説明する。文字線幅認識サブルーチン#500が開始すると、先ず、
ステップS502において、文字線幅認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字線幅認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、予め文字線幅認識を行うか否かを決めておいても良い。そして、制御は次のステップS504に進む。
ステップS504において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pcが特定される。そして、制御は次の本ステップS506に進む。
ステップS506において、ステップS504で特定された文字画素Pcに対して、文字線幅認識処理を施す順番が決定されると共に、決定された順番に文字画素Pcを1つずつ選択される。好ましくは、設定された文字画素Pc毎に、同一色判定処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象が選択される。そして、制御は次のステップS508に進む。
ステップS508において、ステップS506で選択された文字画素Pcに対して、水平方向の連続値Chをカウントする。そして、制御は次のステップS510に進む。
ステップS510において、ステップS506で選択された文字画素Pcに対して、垂直方向の連続値Cvがカウントされる。そして、制御は次のステップS512に進む。
ステップS512において、ステップS504において、特定された全ての文字画素Pcのうちで、連続値Chおよび連続値Cvがカウントされていないものが残っているか否かが判断される。Yesの場合、制御はステップS506に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、連続値Chおよび連続値Cvがカウントされた時点で、制御は次のステップS514に進む。
ステップS514において、ステップS508でカウントされた連続値Chの平均をとって、文字サイズ幅Cwlが求められる。そして、制御は次のステップS516に進む。
ステップS516において、ステップS510でカウントされた連続値Cvの平均をとって、文字サイズ幅Cwが求められる。そして、制御は次のステップS518に進む。
ステップS518において、連続値Chが文字線幅Cwlより極端に大きいか否かが判断される。なお、この極端の程度は、映像ストリームSVcおよび文字情報Icに基づいて、適宜決定される。Yes、つまり文字画素Pcは、文字サイズ幅Cwlの観点からみれば文字情報Icに対応するものでは無いと判断される場合、制御は次のステップS520に進む。
ステップS520において、文字画素Pcが文字画素座標情報Cpから登録削除される。そして、制御はステップS522に進む。
ステップS522において、連続値Cvが文字サイズ幅Cwより極端に大きいか否かが判断される。なお、この極端の程度は、映像ストリームSVcおよび文字情報Icに基づいて、適宜決定される。Yes、つまり文字画素Pcは文字線幅Cwlおよび文字サイズ幅Cwの両方の観点から、文字情報Icに対応するものでは無いと判断される場合、制御は次のステップS524に進む。
ステップS524において、文字画素Pcが文字画素座標情報Cpから登録削除される。なお、本ステップにおいて削除される前に、ステップS520において、文字画素Pcは既に文字画素座標情報Cpから削除されているので、処理の重複を避ける為に本ステップは省略しても良い。しかしながら、当該文字画素Pcに対する文字線幅確認の精度を確保する為には、本ステップを残すことにより、文字画素Pcが文字線幅Cwlおよび文字サイズ幅Cwの両方の観点から文字情報Icに対応するものでは無いとの判定結果を文字画素座標情報Cpに記録することによって、より高精度な文字情報Icの認識および加工を可能にする。そして、制御はステップS530に進む。
上述のステップS522においてNo、つまり文字画素Pcは、文字線幅Cwlの観点からは文字情報Icに対応するものと判断さ、文字サイズ幅Cwの観点からも文字情報Icに対応するものであると判断される場合、制御はステップS524をスキップして、ステップS530に進む。
また、上述のステップS518においてNo、つまり文字画素Pcは文字サイズ幅Cwlの観点からみれば文字情報Icに対応するものであると判断される場合、制御はステップS526に進む。
ステップS526において、ステップS522におけるのと同様に、連続値Cvが文字サイズ幅Cwより極端に大きいか否かが判断される。Yes、つまり文字画素Pcは、文字線幅Cwlの観点からみれば文字情報Icと判断されるが、文字サイズ幅Cwの観点からは、文字情報Icでは無いと判断される場合、制御は次のステップS528に進む。
ステップS528において、文字画素座標情報Cpから文字画素Pcが文字画素座標情報Cpから登録削除される。なお、本ステップにおいては、文字画素座標情報Cpには文字画素Pcが、文字線幅Cwlの観点からは文字情報Icであると判断されるが、文字サイズ幅Cwの観点からは文字情報Icではないと判断されることも記録することによって、より高精度な文字情報Icの認識および加工を可能にする。
ステップS530において、上述のステップS520、S524、およびS530のぞれぞれで補正された文字画素座標情報Cpに基づいて、文字フレーム情報Fcが補正される。そして、文字線幅認識サブルーチン#500の処理は終了する。なお、上述のステップS502においてNoの場合は、制御はステップS502〜S530をスキップして、文字線幅認識処理を行わないで、文字縁取り認識サブルーチン#600に進む。
次に、図14および図15を参照して、文字縁取り認識サブルーチン#600における処理について説明する。文字縁取り認識サブルーチン#600は、文字の表示方法として頻繁に用いられる一定色で、各文字が縁取られて表示される文字情報Icを認識するものである。図14に、図4に示した文字情報Icの「C」を含む限定領域を拡大して示す。同図に例示するように、一般的に文字を縁取りする際に、その縁取り画素Poの色は同一である。即ち、縁取り部分に位置する画素P(x,y)の輝度値VY、色差Cbおよび色差Crのそれぞれの値は同一である。いいかえれば、輝度値VY、色差Cbおよび色差Crのそれぞれの値が同一の画素P(x,y)は、縁取り画素Poの可能性が非常に高い。
よって、文字表示画素テーブル記憶メモリ013に登録されている文字画素Pcの周辺に位置する画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrの値がそれぞれ同一であるかどうかを判定し、ある一定割合以上の周辺画素P(x,y)が同一の輝度値VY、色差Cb、色差Crを持つ場合は、文字が縁取り表示されていると認識する。なお、周辺に位置する画素P(x,y)とは、文字画素Pcの水平そして垂直方向の正負方向に、それぞれ最も近接する文字画素Pcではない4つの画素P(x,y)を言う。
そして、文字表示画素テーブル記憶メモリ013に、文字の表示方法として縁取りが用いられている事を記憶する。この場合、好ましくは、検出された縁取り画素Poの座標(x,y)も文字画素座標情報Cpの一部として記録される。抽出された縁取り画素Poの縁取り色で周辺画素が描画されていない文字画素Pcの登録を削除することで文字情報Icの認識精度をさらに向上させる。文字画素の誤検出を低減させる。
図15を参照して、文字縁取り認識サブルーチン#600における詳細な動作について説明する。文字縁取り認識サブルーチン#600が開始すると、先ず、
ステップS602において、文字の縁取認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字の縁取認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め文字縁取確認を行うか否かを決めておいても良い。そして、制御は次のステップS604に進む。
ステップS604において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pcが特定される。そして、制御は次の本ステップS606に進む。
ステップS606において、ステップS604において特定された文字画素Pcの周辺画素Ppの座標(x,y)が特定される。さらに、特定された周辺画素Ppの総数Nppが算出される共にカウンタCtがゼロにセットされる。なお、上述のように、本例においては、文字画素Pcの水平そして垂直方向の正負方向に、それぞれ最も近接する文字画素Pcではない4つの画素P(x,y)が周辺画素Ppとして特定される。そして、制御は次のステップS608に進む。
ステップS608において、ステップS606で特定された周辺画素Ppに対して、縁度認識処理を施す順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。好ましくは、設定された周辺画素Pp毎に、縁取認識処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、次の周辺画素Ppが選択される。そして、制御は次のステップS610に進む。
ステップS610において、周辺画素Ppの輝度値VY、色差値VCb、および色差値VCrが検出さられる。そして、制御は次のステップS612に進む。
ステップS612において、ステップS606において、特定された全ての周辺画素Ppのうちで、輝度値VY、色差値VCb、および色差値VCrが検出されていないものが残っているか否かが判断される。Yesの場合、制御はステップS608に戻って、次の周辺画素Ppが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、連続値Chおよび連続値Cvがカウントされた時点で、制御は次のステップS614に進む。
ステップS614において、求められた全ての輝度値VY、色差値VCb、および色差値VCrそれぞれの平均をとって、平均輝度値VY(mean)、平均色差値VCb(mean)、および平均色差値VCr(mean)が求められる。そして、制御は次のステップS615に進む。
ステップS615において、ステップS608におけるのと同様に、但し、周辺画素Ppが同一色で表示されているか否かを判断する順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。そして、制御は次のステップS616に進む。
ステップS616において、ステップS615において選択された周辺画素Ppに関して、輝度値VY、色差Cb値信号、および色差値VCrのそれぞれが、平均輝度値VY(mean)、平均色差値VCb(mean)、および平均色差値VCr(mean)と同程度の値を有するか否かが判断される。なお、同程度の度合いは、映像ストリームSVcおよび文字情報Ic、さらに縁取に応じて、適宜決められる。Yes、つまり当該周辺画素Ppは縁取り画素Poであると判断される場合、制御は次のステップS618に進む。
ステップS618において、カウンタCtが1だけインクリメントされる。そして、制御は次のステップS620に進む。
ステップS620において、ステップS612におけるように、但し、ステップS615において選択された周辺画素Ppのうちで、縁取り画素Poであるかの判断が下されていないものが残っているか否かが判断される。Yesの場合、制御はステップS615に戻って、次の周辺画素Ppが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての周辺画素Ppが縁取り画素Poであるか否かの判断が成された時点で、制御は次のステップS618に進む。
一方、上述のステップS616においてNo、つまり当該周辺画素Ppは縁取り画素Poでないと判断される場合、ステップS618およびステップS620をスキップして、制御はステップS615に戻る。
ステップS622において、ステップS618で求められたカウンタCtの値を、周辺画素Ppの総数Nppで除算して、同一色で表示されている周辺画素Ppの同一色割合Dを求める。そして、制御は次のステップS624に進む。
ステップS624において、ステップS615におけると同様に、但し、周辺画素Ppが縁取画素であるか否かを判断する順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。そして、制御は次のステップS626に進む。
ステップS626において、ステップS622で求められた同一色割合Dが、割合閾値Dthより小さいか否かが判断される。なお、割合閾値Dthは、映像ストリームSVc、文字情報Ic、および縁取りの状態に応じて、適宜決められる。そして、制御は次のステップS628に進む。Yes、つまり周辺画素Ppは縁取り画素Poでは無いと判断される場合、制御は次のステップS628に進む。
ステップS628において、当該周辺画素Ppに対応する周辺画素Ppが、文字画素座標情報Cpから登録削除される。そして、制御は次のステップS630に進む。
ステップS630において、周辺画素Ppが文字画素座標情報Cpとして文字表示画素テーブル記憶メモリ013に登録される。そして、制御は次のステップS632に進む。
ステップS632において、文字画素座標情報Cpに基づいて、文字フレーム情報Fcが適宜補正される。そして、制御は次のステップS634に進む。
ステップS634において、ステップS624において選択される、全ての周辺画素Ppで縁取画素であるか否かが判断されていないものが残っているか否かが判断される。Noの場合制御は、ステップS624にも戻る。
上述のステップS626でNoと判断される場合、制御はステップS628、S630、S632、およびS634をスキップして、ステップS624に戻る。
ステップS634において、Noと判断されたときに文字縁取り認識サブルーチン#600の処理は終了する。
次に、図16および図17を参照して、点滅表示認識サブルーチン#700における処理について説明する。点滅表示認識サブルーチン#700は文字の表示方法として頻繁に用いられる、消去と表示を一定時間毎に繰り返して、各文字が点滅表示される文字情報Icを認識するものである。図16に、左か右へと時間の経過と共に、3つの画面画像Ib1、Ib2、およびIb3が示されている。画面画像Ib1には文字情報Icが表示されており、画面画像Ib2には文字情報Icが表示されておらず、画面画像Ib3には画面画像Ib1と同様に文字情報Icが表示されている。点滅表示では時間軸方向に対して、画面画像Ib1および画面画像Ib2のように文字情報Icが表示さる文字表示区間P1と文字消去区間P2とが交互に出現し、且つ時間軸上のどこにおいても文字表示区間P1と文字消去区間P2との時間的長さ、つまり期間はそれぞれ一定である。
図17に示すフローチャートを参照して、点滅表示認識サブルーチン#700の動作の詳細を説明する。点滅表示認識サブルーチン#700が開始すると、先ず、
ステップS702において、点滅表示認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「点滅表意認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め点滅表意認識を行うか否かを決めておいても良い。そして、制御は、次のステップS704に進む。
ステップS704において、文字表示フレームテーブル記憶メモリ014から文字フレーム情報Fcが読み出される。そして、制御は次のステップS706に進む。
ステップS706において、文字フレーム情報Fcに基づいて、文字表示フレームテーブル記憶メモリ014に登録されたフレームの連続性から、文字表示区間P1が検出される。そして制御は、次のステップS708に進む。
ステップS708において、文字フレーム情報Fcに基づいて、文字表示フレームテーブル記憶メモリ014に登録されたフレームの連続性が途切れている間の時間から文字消去区間P2が検出される。そして制御は、次のステップS710に進む。
ステップS710において、文字情報Icは点滅表示であるか否かが判断される。具体的には、ステップS706とステップS708においてそれぞれ検出された文字表示区間P1と文字消去区間P2が所定値を持っている場合、点滅表示と判断される。そして、制御は、次のステップS712に進む。
ステップS712において、文字情報Icは点滅表示であることが文字フレーム情報Fcに記憶される。そして制御は、点滅表示認識サブルーチン#700の処理が終了する。
なお、ステップS710において、文字情報Icは点滅表示ではないと判断される場合、制御はステップS712をスキップして、点滅表示認識サブルーチン#700の処理が終了する。同様に、ステップS702においてNoの場合、制御はステップS704〜S710をスキップして、点滅表示認識サブルーチン#700の処理が終了する。
次に、図18および図19を参照して、移動表示認識サブルーチン#800について説明する。移動表示認識サブルーチン#800は、文字の表示方法として頻繁に用いられる、文字情報Icが一定の速度で水平または垂直方向に移動する移動表示を認識する処理である。図18に、移動表示であるフレームで表示された文字画素が時間軸の進行方向に対し水平に移動して表示される様子を示す。すなわち、ある時間におけるフレームN上の文字情報Icは、フレームN±β(βは任意の正の整数)における文字画素Pcを水平または垂直方向にβフレーム分移動させたものに一致するはずである。
すなわち、文字表示画素テーブル記憶メモリ013に登録されているフレームNの文字画素Pcの分布と、文字表示画素テーブル記憶メモリ013に登録されたフレームN±βにおける文字画素Pcの位置を水平または垂直方向にβフレーム分ずらしたものの分布が一致する場合、文字情報Icは移動表示されていると認識すると共に、文字情報Icがβフレーム分移動表示されていることを文字表示画素テーブル記憶メモリ013に記憶する。
次に、図19を参照して、移動表示認識サブルーチン#800の動作について詳細に説明する。移動表示認識サブルーチン#800の動作が開始すると、先ず、
ステップS802において、移動表示認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「移動表示認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め移動表示認識を行うか否かを決めておいても良い。Yesの場合、制御は次のステップS804に進む。
ステップS804において、文字画素座標情報Cpおよび文字フレーム情報Fcがそれぞれ文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から読み出される。そして、制御は、次のステップS806に進む。
ステップS806において、文字画素座標情報Cpおよび文字フレーム情報Fcに基づいて、フレームN(Nは任意の正の整数)の、文字画素Pcの画面画像Iにおける画素分布Dnを求める。そして、制御は次のステップS808に進む。
ステップS808において、フレームN±βにおける文字画素Pcの画面画像Iにおける画素分布Dβを求める。正確に言えば、フレームNに対してβフレーム分だけ前の画素分布Dβ−と、フレームNに対してβフレーム分だけ後の画素分布Dβ+の2種類が存在するが、紙面および説明の便宜上、画素分布Dβ−と画素分布Dβ+とを画素分布Dβと総称する。そして、制御は次のステップS810に進む。
ステップS810において、次式(3)に基づいて、フレームNにおける画面画像Inにおける文字情報Icが最大動き得る量を表す移動係数dが算出される。
d = − ρ + △ρ ・・・・(3)
移動量ρは、画面画像Inにおける画素解像度に対応する移動量、Δρは、画面画像Inにおける画素解像度に対応する最小移動量。そして、制御は次のステップS812に進む。
ステップS812において、ステップS804で求めた画素分布Dnに基づいて、フレームNに対して移動係数dだけ移動した時の画素分布Dn(d)が算出される。そして制御は、次のステップS814に進む。
ステップS814において、ステップS812で求めた画素分布Dn(d)がステップS808で求められた画素分布Dβと一致するか否かが判断される。具体的には、画素分布Dβから画素分布Ddを減じた値が0になるか否かが判断される。Yes、つまり一致する(減算結果が0の)場合、制御は次のステップS816に進む。
ステップS816において、文字情報Icが移動表示であることを、文字フレーム情報Fcおよび文字画素座標情報Cpに書き込む。そして、制御は次のステップS818に進む。
一方、上述のステップS814でNo、つまり、画素分布Dn(d)は画素分布Dβと一致しないと判断される場合、制御はステップS816をスキップして、ステップS818に進む。
ステップS818において、ステップS810でΔρずつインクリメントされた移動係数dが移動量ρ以上であるか否かが判断される。No、つまり、画面画像Inにおける文字情報Icの最大移動可能範囲に対する画素分布Dn(d)に関して、画素分布Dβと一致の判断が終わっていないことを意味するので、制御は上述のステップS810に戻る。
Yesの場合、画面画像Inにおける文字情報Icの最大移動可能範囲に対する画素分布Dn(d)に関して、画素分布Dβと一致の判断が終わっていることを意味するので、移動表示認識サブルーチン#800を終了する。
なお、上述の同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800は、事前に文字画素座標情報Cpおよび文字フレーム情報Fcが生成されていれば良い。よって、この意味において、本例においては、先行する高輝度値画素検索サブルーチン#200の後であれば、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800のそれぞれを実施する順番は、必要に応じて変更しても良い。さらに、認識対象である文字情報Icの種類に応じて、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800の内で適当なものを選択して実施しても良い。
次に、図20および図21を参照して、文字加工器012について説明する。文字加工器012は、文字認識器011によって認識された文字情報Icの文字画素Pcに関する情報に基づいて、映像ストリームSVcから文字情報Icに対して種々の処理を施す機能を有する。文字加工器012は、文字情報Icを消去する文字情報消去機能、文字情報Icが点滅表示時に文字情報Icを消去する文字情報消去機能、文字情報Icが移動表示時に文字情報Icを削除する文字情報消去機能、文字情報Icを移動させる文字情報移動機能、文字情報Icを拡大/縮小表示させる文字情報拡倍機能、および文字情報Icを特定の注目領域以外の領域に移動表示させる注目領域回避機能を有する。
図20を参照して、文字加工器012の文字加工の主な動作について説明する。文字認識器011における上述の認識処理を経て、輝度信号Y、色差Cb信号、および色差Cr信号が文字加工器012に入力された時点で、文字加工器012の文字加工処理が開始する。なお、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014には、上述の認識処理結果を反映した状態の文字フレーム情報Fcおよb文字画素Pcが格納されている。
先ず、ステップS1002において、映像ストリームSVcに対して、文字情報Icを消去する文字消去処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報消去処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は次のステップS1004に進む。
ステップS1004において、映像ストリームSVcは、文字情報Icが点滅表示されているか否かが判断される。具体的には、文字フレーム情報Fcおよび文字画素座標情報Cpに、文字情報Icが点滅表示である旨の記録があるか否かに基づいて、判断される。Noと判断される場合、次のステップS1006に進む。一方、Yesの場合、制御は次の点滅表示時文字情報消去サブルーチン#1100に進む。
点滅表示時文字情報消去サブルーチン#1100において、点滅表示されている文字情報Icが映像ストリームSVcから消去される。これについては、後ほど詳述する。点滅表示時文字情報消去サブルーチン#1100の処理の後、文字加工器012による文字加工処理が終了する。
ステップS1006において、映像ストリームSVcは、文字情報Icが移動表示されているか否かが判断される。具体的には、文字フレーム情報Fcおよび文字画素座標情報Cpに、文字情報Icが移動表示である旨の記録があるか否かに基づいて、判断される。Noの場合、制御は文字消去サブルーチン#1300に進む。一方、Yesの場合、制御は次の移動表示時文字情報消去サブルーチン#1200に進む。
移動表示時文字情報消去サブルーチン#1200において、移動表示されている文字情報Icが映像ストリームSVcから消去される。これについては、後ほど図?を参照して詳述する。移動表示時文字情報消去サブルーチン#1200の処理の後、文字加工器012による文字加工処理が終了する。
文字消去サブルーチン#1300において、文字情報Icが映像ストリームSVcから消去される。これについては、後ほど詳述する。文字消去サブルーチン#1300の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1002においてNo、つまり文字消去処理は実施されない場合、逝去はステップS1008に進む。
ステップS1008において、映像ストリームSVcに対して、文字情報Icを移動する文字移動処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報移動処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。さらに、好ましくは、ユーザが所望の移動量Sを入力するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、文字情報拡倍サブルーチン#1400に進む。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は文字情報移動サブルーチン#1400に進む。
文字情報移動サブルーチン#1400において、文字情報Icが映像ストリームSVcにおいて、その表示場所が変更、つまり文字情報Icが画面画像Iにおいて移動させられる。これについては、後ほど図23を参照して詳述する。文字情報移動サブルーチン#1400の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1008においてNo、つまり文字情報移動処理が行われない場合に、制御はステップS1010に進む。
ステップS1010において、映像ストリームSVcに対して、文字情報Icを拡大/縮小表示させる文字情報拡倍処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報拡倍処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。さらに、好ましくは、ユーザが所望の拡倍率Mを入力するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は文字情報拡倍サブルーチン#1500に進む。
文字情報拡倍サブルーチン#1500において、文字情報Icが映像ストリームSVcにおいて、拡大表示される。これについては、後ほど図24を参照して詳述する。文字情報拡倍サブルーチン#1500の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1010においてNo、つまり、文字情報Icの拡大表示処理が行われない場合、制御はステップS1012に進む。
ステップS1012において、文字情報Icにおける注目領域以外の領域に文字情報Icを移動表示させるか否かが判断される。好ましくは、ユーザに対して、モニタに「注目領域回避処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、注目領域回避サブルーチン#1600に進む。
注目領域回避サブルーチン#1600において、文字情報Icが映像ストリームSVcにおいて、画面画像Iの視聴者が注目し易い領域から、視聴者の気にならない領域に移動させられる。これについては、後ほど図25を参照して詳述する。注目領域回避サブルーチン#1600の処理の後、文字加工器012による文字加工処理が終了する
このように、文字消去を行う場合に、点滅表示認識サブルーチン#700において点滅表示と認識されている場合は、点滅表示時文字情報消去サブルーチン#1100において文字情報Icが消去される。移動表示認識サブルーチン#800において移動表示と認識されている場合は、移動表示時文字情報消去サブルーチン#1200において文字情報Icが消去される。その他の場合は、文字情報消去サブルーチン#1300において文字情報Icが消去される。
また、文字移動を行う場合には、文字情報移動サブルーチン#1400において文字情報Icが移動される。また、文字拡倍を行う場合には、文字情報拡倍サブルーチン#1500において文字情報Icが拡倍される。また、注目領域回避を行う場合には、注目領域回避サブルーチン#1600において非注目領域に文字情報Icが移動されて表示される。
次に、図21および図22を参照して、文字情報消去サブルーチン#1300の動作について説明する。図21に、画面画像Iにおける文字画素Pcを示す。同図において文字画素Pc(x,y)を消去する方法について述べる。文字画素Pc(x,y)の水平または垂直方向の正負方向に最も近傍する、文字画素Pcおよび縁取り画素Poの何れでもない4つの画素Pに基づいて、文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrを線形補間することで文字情報Icを消去する。なお、文字画素Pc(x,y)が縁取り画素Poの場合であっても同様にして、近傍の画素Pに基づいて消去する縁取り画素Poの輝度値VY、色差値VCb、および色差値VCrを補間して消去する。なお、この文字画素Pc或いは縁取り画素Poの補間処理は、文字表示画素テーブル記憶メモリ013に登録されている文字画素座標情報Cpに基づいて行われて、文字情報Icの補間値が算出される。
つまり、文字加工器012は、0011から入力される輝度信号Y、色差Cb信号、および色差Cr信号のそれぞれに対して、求めた補間値を上書きして、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを生成して出力する。被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTは、それぞれ、出力用メモリ004の被処理輝度フレームメモリ008、被処理色差Cbフレームメモリ009、および被処理色差Crフレームメモリ010に一旦保持された後、後処理器015で映像ストリームSVtに合成される。なお、映像ストリームSVtにおいては、映像ストリームSVcに組み込まれていた文字情報Icは、消去されている。
図22を参照して、文字消去サブルーチン#1300の動作について詳述する。図20に示すフローチャートにおいて、ステップS1006においてNoと判断された時点で、文字消去サブルーチン#1300の動作が開始される。
先ず、ステップS1302において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1304に進む。
ステップS1304において、文字画素座標情報Cpに基づいて、フレーム単位で補間処理をする文字画素Pc(x,y)が選択される。そして、制御は次のステップS1306に進む。
ステップS1306において、上述の方法にて、ステップS1304で選択された文字画素Pcに対する補間輝度値VYt、補間色差値VCbt、および補間色差値VCrtが求められる。そして、制御は次のステップS1308に進む。
ステップS1308において、当該文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ、ステップS1306において求められた補間輝度値VYt、補間色差値VCbt、および色差値VCrtで上書きされる。そして、制御は次のステップS1310に進む。
ステップS1310において、ステップS1302において読み出された文字画素座標情報Cpで規定される、補正対象の文字画素Pc(x,y)の内で、補間輝度値VYt、補間色差値VCbt、および補間色差値VCrtが求められていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1304に戻り、ステップS1304〜ステップS1308における処理が繰り返されて、当該フレームのおける全ての文字画素Pc(x,y)が補間輝度値VYt、色差値VCrt、および補間色差値VCbtによって上書きされて、文字情報Icが画面画像Iから消去される。
このように、文字画素Pc(x,y)が処理された輝度信号Y、色差Cb信号、および色差Cr信号を、それぞれ被処理輝度信号YT、被処理色差Cb信号CbT、被処理色差Cr信号CrTと呼ぶ。本ステップにおいてNoと判断された時点で、制御は次のステップS1312に進む。
ステップS1312において、画素値が書き換えられた文字画素Pc(x,y)に値王する被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが出力用メモリ004に出力される。なお、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTは、後処理器015によって、映像ストリームSVtに合成される。そして、映像ストリームSVtには、映像ストリームSVcにおいて組み込まれていた文字情報Icが消去されていることは上述の通りである。なお、ステップS1306における補間輝度値VYt、補間色差値VCbt、および色差値VCrtの算出の方法を除けば、文字消去サブルーチン#1300は基本的に、点滅表示時文字情報消去サブルーチン#1100および移動表示時文字情報消去サブルーチン#1200にも適用できる。これについては、以下に述べる。
点滅表示時文字情報消去サブルーチン#1100は、点滅表示認識サブルーチン#700によって文字情報Icの表示方法が点滅表示であると認識されている場合のみに選択され得る処理である。文字消去の対象である文字画素Pcまたは縁取り画素Poの輝度値VYと色差値VCbと色差値VCrのそれぞれの補間値として、時間的に最も近接する文字消去区間P2内のフレームにおいて対応する画素P(x,y)の値が用いられる。この処理を文字表示画素テーブル記憶メモリ013に登録された文字画素Pcおよび/或いは、縁取り画素Poにたいして施すことで文字情報Icの補間値(補間輝度値VYt、補間色差値VCbt、色差値VCrt)が算出される。
補間値を求める対象が同一フレームではなく、時間的近接フレームである点を除いて、点滅表示時文字情報消去サブルーチン#1100の動作は、上述の文字情報消去サブルーチン#1300における動作と同様である。また、文字情報消去サブルーチン#1300においても、ステップS1308において、文字情報消去サブルーチン#1300におけるのと同様に、同一フレームではなく、時間的近接フレームから補間値を求めても良い。
文字加工器012によって、文字認識器011から出力された輝度信号Y、色差Cb信号、および色差Cr信号に対して、この算出された補間値(補間輝度値VYt、補間色差値VCbt、色差値VCrt)を上書きして、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを生成して、出力用メモリ004を介して後処理器015に出力される。そして、後処理器015は処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを合成して、映像ストリームSVtを生成する。この映像ストリームSVtの画面画像Iには、映像ストリームSVcで点滅表示されていた文字情報Icが消去されている。
移動表示時文字情報消去サブルーチン#1200は、移動表示認識サブルーチン#800によって文字情報Icの表示方法が移動表示であると判定された場合のみに選択され得る処理である。文字消去の対象となる文字画素Pcまたは縁取り画素Poの輝度値VY、色差値VCb、および色差値VCrそれぞれの補間値として、対象となる画素が文字画素Pcとして登録されていないフレームのうち、時間的に最も近接するフレームにおいて対応する画素P(x,y)の値が用いられる。以降の動作は、上述の文字消去サブルーチン#1300および点滅表示時文字情報消去サブルーチン#1100におけるのと同様である。結果、後処理器015から出力される映像ストリームSVtの画面画像Iには、映像ストリームSVcで移動表示されていた文字情報Icが消去されている。
以下に、図23を参照して、文字情報移動サブルーチン#1400の動作の詳細について説明する。文字情報移動サブルーチン#1400は、文字情報Icを映像ストリームSvcにおける位置から別の位置に移動させる文字加工器012による処理である。つまり、消去対象とする文字情報Icが点滅表示であっても、移動表示であっても構わない。
先ずステップS1402において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1404に進む。
ステップS1404において、移動させる文字画素Pc(x,y)が選択される。そして、制御は次のステップS1406に進む。
ステップS1406において、当該文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrが注意出される。なお、説明の便宜上、本ステップで抽出されて文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrをそれぞれ、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)と識別する。すなわち、本ステップにおいては、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出される。そして、制御は次のステップS1408に進む。
ステップS1408において、移動対象である文字画素Pc(x,y)の内で、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出されていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1404に戻り、ステップS1404〜ステップS1406における処理が繰り返されて、移動対象である全ての文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出された後に、本ステップでNoと判断される。そして、制御は次の文字消去サブルーチン#1000に進む。
文字消去サブルーチン#1000は、図22に示した文字消去サブルーチン#1300から、文字画素座標情報Cpおよび文字フレーム情報Fcを読み出すステップS1302を削除したものである。なお、文字消去サブルーチン#1000においては、削除されたステップS1302の変わりに、上述のステップS1402で読み出された文字画素座標情報Cpおよび文字フレーム情報Fcに基づいて、文字削除処理を行う。移動させる文字画素Pc(x,y)が消去された、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが生成される(S1312)。そして、制御は次のステップS1410に進む。
ステップS1410において、文字情報Icの移動先である画素P(x,y)が選択される。この移動先の画素P(x,y)は、ステップS1404で選択されえた移動元の文字画素Pc(x,y)を所定距離分だけ移動させたものに対応する。そして、制御は次のステップS1412に進む。
ステップS1412において、ステップS1410で選択された画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ、ステップS1406において求められた文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされる。そして、制御は次のステップS1414に進む。
ステップS1414において、移動先である画素P(x,y)の内で、輝度値VY、色差値VCb、および色差値VCrが文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)に上書きされていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1410に戻り、ステップS1410〜ステップS1414における処理が繰り返されて、全ての移動先画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされた後に、本ステップでNoと判断される。そして、制御は次のステップS1416に進む。
ステップS1416において、上述のステップS1312において生成されて、出力用メモリ004に格納されている被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが、ステップS1412で書き換えられた輝度値VY、色差値VCb、および色差値VCrで更新される。そして、更新された被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが後処理器015によって合成されて、文字情報Icが移動した映像ストリームSVtが生成される。
次に、図24を参照して、文字情報拡倍サブルーチン#1500の動作について説明する。文字情報拡倍サブルーチン#1500は、文字加工器012による文字加工処理として文字情報Icを映像ストリームSVcに含まれていた状態から拡大/縮小させて表示する拡倍処理である。
先ずステップS1502において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1504に進む。
ステップS1504において、拡倍させる文字画素Pc(x,y)が選択される。そして、制御は次のステップS1506に進む。
ステップS1506において、当該文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出される。そして、制御は次のステップS1508に進む。
ステップS1508において、拡倍対象である文字画素Pc(x,y)の内で、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出されていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1504に戻り、ステップS1504〜ステップS1506における処理が繰り返されて、全ての拡倍対象である文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出された後に、本ステップでNoと判断される。そして、制御は次の文字消去サブルーチン#1000に進む。
文字消去サブルーチン#1000において、拡倍させる文字画素Pc(x,y)が消去された、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが生成される(S1312)。そして、制御は次のステップS1510に進む。
ステップS1510において、拡倍された後の文字情報Icに対応する文字画素Pc(x,y)を求める。具体的には、文字情報Icを構成する文字画素Pc(x,y)の座標(x,y)に拡倍量Mを乗算して、拡倍後の文字画素Pc(x×M、y×M)を求める。なお、拡倍量Mは、0より大きな任意の整数である。つまり、拡倍処理によって、拡倍後の文字情報Icの大きさかは、拡倍前より大きくても小さくても良い。そして、制御は次のステップS1512に進む。
ステップS1512において、文字画素Pc(x×M、y×M)に相当する画素P(x×M、y×M)を特定する。そして、制御は次のステップS1514に進む。
ステップS1514において、ステップS1512において特定された画素P(x×M、y×M)の全てに対して、拡倍処理を施す順番を決定すると共に、その順番にしたがって1つずつ選択する。そして、制御は次のステップS1516に進む。
ステップS1516において、ステップS1514において選択された画素P(x×M、y×M)の輝度値VY、色差値VCb、および色差値VCrのそれぞれをステップS1506において抽出された文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きする。このようにして、元の文字画素Pc(x,y)と同じ輝度および色差を有する画素P(x×M、y×M)によって、文字情報Icが拡大される。そして、制御は次のステップS1518に進む。
ステップS1518において、ステップS1512で特定された画素P(x×M、y×M)の内で、その輝度値VY、色差値VCb、および色差値VCrのそれぞれが、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされていないものが残っていないかが判断される。全ての画素P(x×M、y×M)が上書きされて、文字情報Icが拡大された後に制御は次のステップS1520に進む。
ステップS1520において、上述のステップS1312において生成されて、出力用メモリ004に格納されている被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが、ステップS1516で書き換えられた輝度値VY、色差値VCb、および色差値VCrによって更新される。そして、更新された被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが後処理器015によって合成されて、文字情報Icが移動した映像ストリームSVtが生成される。
なお、拡倍量Mが1より小さい場合には、拡倍処理によって、1つ以上の文字画素Pc(x,y)が、1つの画素P(x×M、y×M)で表現される。よって、文字情報Icのみならず、線幅も縮小される。一方、拡倍量Mが1より大きい場合には、隣接する複数の文字画素Pc(x,y)によって表現されていた線が、拡倍量Mによっては、数個の画素P(x,y)分だけ離間した画素P(x×M、y×M)によって表現される。このような場合、本来1本として表される線が互いに離間した複数の細線或いは、互いに離間した点の集まりとして表現されて、見難いものとになる。このような事態を避けるために、ステップS1518とステップS1520の間に、画素P(x×M、y×M)の間に位置する画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrのそれぞれを文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きするステップを設けてれば良い。
次に、図25を参照して、注目領域回避サブルーチン#1600の動作について説明する。注目領域回避サブルーチン#1600は、文字加工器012による文字加工処理として、画面画像Iにおいて人間が注目する注目領域と、人間が注目しない背景などの動きの少ない非注目領域を自動的に判別して、非注目領域に文字情報Icを移動させる処理である。なお、文字情報Icの移動は、上述の文字情報移動サブルーチン#1400を利用して行われる。すなわち映像ストリームSvcにおけるそれぞれのフレーム毎に、算出された非注目領域と現在の文字情報Ic領域の距離を算出し、算出された距離だけ文字情報Icを移動させる。
注目領域回避サブルーチン#1600が開始すると、先ず、
ステップS1602において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1604に進む。
ステップS1604において、入力用メモリ003から出力される輝度信号Y、色差Cb信号、および色差Cr信号に基づいて、映像ストリームSVcのフレーム毎に非注目領域が認識される。そして、制御は次のステップS1606に進む。
ステップS1606において、ステップS1604において認識された非注目領域の範囲が算出される。好ましくは、非注目領域は、4点で規定される矩形として認識される。そして、この4点に対応する画素P(x,y)の座標と共に、非注目領域の中心に対応する画素P(x,y)が求められる。なお、説明の便宜上、この非注目領域の中心に対応する画素P(x,y)を非注目領域中心画素Pnnと呼ぶ。そして、制御は次のステップS1608に進む。
ステップS1608において、文字画素座標情報Cpに登録されている全ての文字画素Pc(x,y)と非注目領域中心画素Pnnとの水平方向距離および垂直方向距離のそれぞれの平均値である非注目領域水平移動距離Lhnおよび非注目領域垂直移動距離Lvnが算出される。なお、上述の移動量Sは、非注目領域水平移動距離Lhnおよび非注目領域垂直移動距離Lvnで決定される量である。そして、制御は次の文字情報移動サブルーチン#1400Rに進む。
文字情報移動サブルーチン#1400R、図23に示した文字情報移動サブルーチン#1400から、文字画素座標情報Cpおよび文字フレーム情報Fcを読み出すステップS1402を削除したものである。なお、文字情報移動サブルーチン#1400Rにおいては、削除されたステップS1402の変わりに、上述のステップS1602で読み出された文字画素座標情報Cpおよび文字フレーム情報Fcと、移動量S1608において求められた移動量Sに基づいて、文字情報Icは非注目領域に移動される。
図26を参照して、本発明の実施の形態に係る映像処理装置における記録装置について説明する。記録装置Arは、上述の映像処理装置Avpにより生成された映像ストリームSvtを、記録媒体019に記録する機能を実現する為に、エンコーダ016、記録部017、記録コントローラ018を含む。エンコーダ016は、上述の後処理器015より入力される映像ストリームSvtを記録媒体019への記録に適したデータ形式になるようにエンコードして、記録用映像ストリームSvtrを生成する。記録部017は記録用映像ストリームSvtrを記録媒体019に記録する。なお、記録コントローラ018は、記録装置Arの全体(エンコーダ016および記録部017)の動作を制御する。
この場合、記録コントローラ018は、映像処理装置Avpの後処理器015から映像ストリームSvtを出力させるために、後処理器015の動作を制御しても良い。また、記録装置Arは映像処理装置Avpと一体的に構成することもできる。この場合、記録コントローラ018の機能はシステムコントローラ030に兼任させても良い。
次に、図27を参照して、本発明の実施の形態に係る映像処理装置における再生表示装置について説明する。再生表示装置Apは、上述の映像処理装置Avpにより生成された映像ストリームSvtを映音像として提示する為に、再生部020、表示部021、および再生コントローラ022を含む。再生部020は後処理器015から入力される映像ストリームSvtに基づいて、表示部021による画像表示および発声に適した形式の映音像信号Savを生成する。表示部021は再生部020から入力される映音像信号Savによって、映像或いは音声を提示する。再生コントローラ022は、再生装置Apの全体(再生部020および表示部021)の動作を制御する。
この場合、再生コントローラ022は、映像処理装置Avpの後処理器015から映像ストリームSvtを出力させるために、後処理器015の動作を制御しても良い。また、再生装置Apは映像処理装置Avpと一体的に構成することもできる。この場合、再生コントローラ022の機能はシステムコントローラ030に兼任させても良い
本発明に係る映像処理装置は、映像ストリームに組み込まれた緊急ニュースなどの文字情報の消去、移動、及び拡倍などの加工に用いることができ、さらにDVDレコーダなどの記録装置やモニタなどの表示装置にも適用できる。
本発明は、例えばテレビジョン放送における緊急ニュースなどの映像ストリームに含まれる字幕に代表される文字情報を、抽出或いは加工する映像処理装置およびその方法に関する。
通常のテレビジョン放送において放送されている番組の録画中に、緊急ニュースなどの文字情報が放送中の番組の画面中に付加されて放送されることがある。このような場合、ユーザは番組の録画を欲しているが、基本的に緊急ニュース自体の録画は望まない。つまり、映像ストリームに含まれる緊急放送などの文字情報は、リアルタイムで視聴する場合は意味を持つが、録画したストリームを視聴する場合(即ち時間が経過した場合)には文字情報が必要でない場合が多い。また、映像ストリームを集中して視聴したい視聴者にとっては、文字情報は快適な視聴の妨げとなる。
そのために、放送されている番組に付加されている文字情報を消去する技術が従来提案されている。そのような技術の例として、放送側で、本来の映像信号とは別に補間信号を入力して映像ストリームを生成しておき、必要に応じて、受信側で映像ストリームから映像信号のみを再生する技術が提案されている(特許技術文献1)。
特開平9−200684号公報
しかしながら、上述の方法においては、映像ストリームとは別に補間信号を挿入して、映像ストリームを作成しておくために、放送の前に、補間信号を用意しておかなければならず、緊急時に即応してニュースを放送するという目的を実質上果たすことができない。それゆえに、緊急時にも直ちに、放送中の番組に文字情報を付加できると共に、必要に応じて付加した番組の画面から文字情報を消去できると言う相反する要望を満たす映像処理方法が必要とされている。
よって、本発明は、放送側で映像信号とは別に補間信号を用意して映像ストリームを生成する必要が無く、受信側で文字放送が付加された映像ストリームから文字情報を精度良く抽出し、消去や移動といった必要な加工を施し、視聴者が望むような映像ストリームを生成できる映像処理方法およびその装置を提供することを目的とする。
本発明は、入力される映像ストリームに組み込まれた文字情報に選択的に処理を施す映像処理方法であって、
前記映像ストリームをフレーム単位で輝度情報を示す輝度フレームと、色差情報を示す複数の色差フレームとに分離する映像ストリーム分離ステップと、
前記輝度情報および前記輝度情報の少なくとも何れかに基づいて、前記組み込まれた文字情報を認識する文字認識ステップと、
前記認識された文字情報に対して、消去、移動、および拡倍の少なくとも何れかの処理を施す文字加工ステップとを備える。
本発明に係る映像処理方法は、例えば緊急ニュースなどの文字情報が含まれる映像ストリームから、文字情報を加工した映像ストリームを生成できる。例えば、DVDレコーダなどの録画機を用いて録画したテレビ番組に文字情報が含まれていた場合、この再生に本発明を適用することによって、文字情報を消去した映像ストリームを再生でき、視聴者の要望にあった快適な視聴環境を提供できる。
先ず、図1を参照して、本発明に係る映像処理装置について説明する。映像処理装置Avpは、前処理器002、入力用メモリ003、文字認識器011、文字加工器012、文字表示画素テーブル記憶メモリ013、文字表示フレームテーブル記憶メモリ014、出力用メモリ004、および後処理器015を含む。映像処理装置Avpは、さらに、全体の動作を制御するシステムコントローラ030および、制御に必要なデータを記憶するメモリ40を含む。
前処理器002は、外部から入力される元々のストリームSv(図示せず)に、文字情報Ic(図2)が組み込まれた映像ストリームSvcを、フレーム毎に、輝度信号Y、色差Cb信号、および色差Crに分離して、入力用メモリ003に出力する。なお、輝度信号Y、色差Cb信号、および色差Crは、それぞれ、図面においては、Y、Cb、およびCrと表示されている。また、輝度信号Y、色差Cb信号、および色差Cr信号をフレーム信号と総称する。
入力用メモリ003は、映像処理装置Avpが映像ストリーム中のある任意のNフレーム目のフレーム信号に対して処理を行う際に、Nフレーム目の前後のある一定時間幅の映像ストリーム量を格納できる容量を持つ記憶領域である。なお、入力用メモリ003は、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007を含む。前処理器002よって分離された、輝度信号Y、色差Cb信号、および色差Cr信号はそれぞれ、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007に格納される。
文字認識器011は、輝度フレームメモリ005、色差Cbフレームメモリ006、および色差Crフレームメモリ007のそれぞれから供給される輝度信号Y、色差Cb信号、および色差Cr信号に文字情報Icが含まれるかどうかを判定する。文字認識器011は、さらに、フレーム内のどの画素が文字情報Icを示す文字画素かを認識して、文字画素の座標位置を表す文字画素座標情報Cpを生成して、文字表示画素テーブル記憶メモリ013に出力する。本明細書においては、説明の便宜上、映像ストリームが表す画面画像を構成する画素を画素Pと呼び、画面画素において文字情報Icを表す画素を文字画素Pcと呼んでそれぞれを識別する。
画面画像は、ラスタスキャンの順番に配置された無数の画素で構成される。そして画素のそれぞれは、水平方向の位置と垂直方向の位置のそれぞれに対応する座標(x,y)によって識別される。つまり、画素Pおよび文字画素Pcのそれぞれを識別する場合には、画素P(x,y)および文字画素Pc(x,y)と表現される。本明細書においては、必要に応じて、個々の画素Pおよび文字画素Pcを、それぞれ画素P(x,y)および文字画素Pc(x,y)と識別するものとする。
文字表示画素テーブル記憶メモリ013はさらに、文字情報Icを表すと認識された(輝度信号Y、色差Cb信号、色差Cr信号の少なくとも何れかと)画素Pを、文字画素Pcとして表す文字画素座標情報Cpを生成して、文字表示画素テーブル記憶メモリ013に出力する。文字画素座標情報Cpは文字画素Pcを特定する、いわば画面画像における文字画素Pcの座標(x,y)を表すデータである。つまり、文字画素Pc(x,y)のデータが文字表示画素テーブル記憶メモリ013において、テーブル状に記録されることより、文字画素座標情報Cpを文字表示画素テーブルと呼ぶことができる。
文字表示フレームテーブル記憶メモリ014は、文字画素座標情報Cpに基づいて、文字情報Icが発見されたフレームを登録する。文字フレーム情報Fcはフレームテーブルを構成するデータであり、この意味において文字フレーム情報Fcを文字表示フレームテーブルと呼ぶことができる。なお、文字フレーム情報Fcは、フレーム番号などの通常フレームの識別に用いられているもので良い。文字認識器011は、文字認識処理後に、輝度信号Y、色差Cb信号、および色差Cr信号を文字加工器012に出力する。なお、後ほど、図2〜図19を参照して、文字認識器011について詳述する。
文字表示画素テーブル記憶メモリ013は、文字画素座標Cpを文字加工器012に供給する。同様に、文字表示フレームテーブル記憶メモリ014は、文字画素Pcを文字加工器012に供給する。文字表示画素テーブル記憶メモリ013は、文字画素座標Cpおよび文字フレーム情報Fcに基づいて、文字認識器011から入力された輝度信号Y、色差Cb信号、および色差Cr信号に含まれる文字情報成分に対して、移動、各倍、および消去に代表される加工処理を施した後に出力用メモリ004に出力する。この加工処理が施された、輝度信号Y、色差Cb信号、および色差Cr信号をそれぞれ、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTと識別する。図面においては、それぞれ、YT、CbT、およびCrTと表示されている。なお、文字表示画素テーブル記憶メモリ013については、後ほど図20〜図25を参照して詳述する。
出力用メモリ004は、被処理輝度フレームメモリ008、被処理色差Cbフレームメモリ009、および被処理色差Crフレームメモリ010を含む(図面では、それぞれ、Yフレームメモリ、Cbフレームメモリ、Crフレームメモリと表示)。なお、出力用メモリ004は、入力用メモリ003と同様に、Nフレーム目の前後の一定時間幅の映像ストリーム量を格納できる容量を持つ記憶領域である。輝度フレームメモリ005、色差Cbフレームメモリ006、および被処理色差Crフレームメモリ010には、それぞれ、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが一時的に格納される。
出力用メモリ004は所定時間だけ、被処理輝度信号YT、色差Cb信号、および色差Cr信号を保持した後に後処理器015に出力する。後処理器015は、被処理輝度信号YT、被処理色差CbT信号、および被処理色差CrT信号をY/C合成して映像ストリームSvtを生成して出力する。なお、映像ストリームSvYは、映像ストリームSvcに含まれている文字情報Icが処理を受けている点を除いては、基本的に映像ストリームSvcと同一である。このようにして、映像処理装置Avpに対して、文字情報Icを含む映像ストリームSvcが入力されると、文字情報Icに対して、移動や各倍や消去などの加工が施された映像ストリームSvtが生成されて出力される。
次に、図2〜図19を参照して、文字認識器011について説明する。図2に、映像ストリームSvcの表す任意のNフレーム目の画面画像Iの一例を示す。なお、画面画像Iは、H×V個の画素P(x,y)で構成される。なお、HおよびVはそれぞれ、規格ごとに定められている所定の整数値である。なお、xは水平(H)方向の位置を示し、yは垂直方向の位置を示す。
同例においては、画面画像Iの大部分は、地面Eと建物Bと空Sとで構成されている。そして、画面画像Iの上部の空Sの部分に「ABCDEFGHI」が表示されている。つまり、この「ABCDEFGHI」が映像ストリームSvに組み込まれた文字情報Icであり、文字情報Ic以外の画像が元の映像ストリームSvである。つまり、文字認識器011は、映像ストリームSvcの各フレームに含まれる「ABCDEFGHI」(文字情報Ic)を認識する。本例においては、「ABCDEFGHI」を表す画素Pが文字画素Pcである。
図3に、文字認識器011の文字認識動作を表すフローチャートを示す。文字認識器011による文字認識は、検索範囲指定サブルーチン#100、高輝度値画素検索サブルーチン#200、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字線幅認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800を含む。
前処理器002によってY/C分離された映像ストリームSvcのフレーム信号である、輝度信号Y、色差Cb信号、および色差Cr信号が文字認識器011に入力された時点で、文字認識動作が開始される。
まず、検索範囲指定サブルーチン#100において、画面上における文字情報Icの検索範囲が予め指定される。一般的に、緊急ニュースなどの文字情報Icは画面の上下左右の端部に表示されることが多い。よって、画面画像Iにおいて、文字情報Icを探索する対象範囲である探索範囲Rsを任意の範囲に限定しておくことで、文字情報Icの誤検出の低減を図る。図2に例示する画面画像Iでは、文字情報Icは画面の上部に表示されているので、探索範囲Rsは画面の上部に設定される。
次に、図4を参照して、映像ストリームSvcに、後から組み込まれた文字情報Icとは別に、元の映像ストリームにも文字情報が含まれている場合の探索範囲Rsについて説明する。図4に示す画面画像Iは、図3に示した画面画像Iと類似しているが、画像の中央部の空Sの部分にも、表示されている建物Bの説明として「1970年 建 築」との文字が表示されている。この「1970年 建 築」は、画像の説明のためのキャプションCsであって、映像ストリームSvに組み込まれた文字情報Icではない。同図に示すように、画像の説明のためにキャプションCsは、文字情報Icとは異なる場所に表示されることが多い。なお、図2および図4に示す例では、文字情報Icは画面の上部に表示されているが、映画の字幕などの場合は、画像の下部に表示されることが多い。何れにしても、映像ストリームSvに後から組み込まれる文字情報Icは、画面画像Iにおいて、画像作成者の意図をできるだけ損なわないような部分に表示されることが多い。
このように、文字情報IcとキャプションCsが混在する可能性があり、さらに文字情報Icの存在する場所の特定が困難な場合には、探索範囲Rsを指定する変わりに、文字情報Icが存在し得ない領域を非探索範囲Rscとして指定する。結果、探索範囲Rsを指定する場合に比べては劣るもの、文字認識処理の負荷を低減すると共に、文字情報Icの誤検出の確率を防止あるいは、誤検出を防止できる。つまり、探索範囲Rsあるいは非探索範囲Rscの指定を行わなくとも、処理負荷が増大および文字情報Icの誤検出の確率の増大を除けば、本サブルーチンの有無は文字認識処理に影響を与えない。
図5を参照して、検索範囲指定サブルーチン#100における動作の詳細について説明する。検索範囲指定サブルーチン#100においては、先ず
ステップS102において、ユーザに対して、入力される映像ストリームSvcに対して、文字画素Pcを探す範囲である探索範囲Rs又は、文字画素Pcを探さない非探索範囲Rscの何れかを設定するか否かが問い合わされる。この問い合わせは、テレビなどの映像ストリームSvcの画像を表示するモニタ(図示せず)に、メッセージを表示するようにしても良いし、音声で行っても良い。この問い合わせに対して、ユーザはリモコンやマウスなどの入力手段を用いて、Yes或いはNoの回答を入力する。ユーザがYesを入力した場合、制御は次のステップS104に進む。
ステップS104においては、ユーザは探索範囲Rs又は非探索範囲Rscを指定する。好ましくは、ユーザは、上述のモニタに表示される映像ストリームSvcの画面画像Iに対して、マウスなどの入力手段を用いて、探索範囲Rs或いは非探索範囲Rscを指定する。なお、指定された探索範囲Rs或いは非探索範囲Rscは、画像を構成する画素Pの座標(x,y)の集合を表す情報として、文字認識器011に入力される。そして、検索範囲指定サブルーチン#100が終了する。なお、ステップS102において、ユーザがNoを回答した場合には、制御は上述のステップS104をスキップして、検索範囲指定サブルーチン#100が終了する。
次に、図6を参照して、高輝度値画素検索サブルーチン#200における動作について説明する。高輝度値画素検索サブルーチン#200は、緊急ニュースなどの文字情報Icは、一般的に、画面上に高輝度で表示される特徴に基づいて、文字情報Icを表示する画素を抽出する。図6に、入力用輝度Yフレームメモリ005に格納されている輝度信号Yであって、図4の画像における文字情報Icの「A」を含む部分の輝度画面画像IYを部分的に拡大して示すと共に、同輝度画面画像IYの水平方向のラインLn上の輝度分布DYを示している。なお、輝度画面画像IYは、H×V個の輝度画素PY(x,y)で構成される。図6において、一つ一つの升目が、輝度画素PY(x,y)を示している。なお、輝度画素PY(x,y)も特に個々を識別する必要のない場合には、単に輝度画素PYと呼ぶ。
また、輝度分布DYにおいて、縦軸はラインLn上の輝度画素PY(x,y)の輝度値VYを示し、横軸はラインLn上の輝度画素PY(x,y)を示している。なお、説明の便宜上、必要に応じて、輝度画面画像IYにおいて、文字情報Icを表示する輝度画素PYを文字輝度画素PYcと呼び、ストリームSvを表示する画素をストリーム輝度画素PYsと呼び、それぞれを識別する。同様に、文字輝度画素PYcおよびストリーム輝度画素PYsの輝度値VYをそれぞれ、文字輝度値VYcおよびストリーム輝度値VYsと識別する。
本例においては、ラインLnは文字情報Icの「A」の上部を横切っている。このように、輝度画面画像IYにおいて、文字情報Icの文字を構成する文字輝度画素PYcの文字輝度値VYcは、映像ストリームSvを表示しているストリーム輝度画素PYsのストリーム輝度値VYsより大きい。よって、本発明においては、文字輝度値VYcとストリーム輝度値VYsを峻別する輝度閾値Vthを予め設定しておき、輝度閾値Vthより大きな輝度値VYを有する輝度画素PYを文字輝度値PYcとして抽出する。なお、このような輝度画面画像IYを構成する個々の輝度画素PY(x,y)の輝度値VYを、予定の輝度閾値Vthと比較するには、好ましくは、ラスタスキャンの順番に行われる。
つまり、高輝度値画素検索サブルーチン#200においては、上述の文字輝度値PYcの抽出処理が、検索範囲指定サブルーチン#100で定められた検索範囲内の全ての画素Pに対して施される。文字情報Icであるとして抽出された文字輝度画素PYcの座標(x,y)を表す文字画素座標情報Cpが生成される。そして、文字表示画素テーブル記憶メモリ013は、文字画素座標情報Cpに基づいて、抽出された文字輝度画素PYcの座標(x,y)を登録する。また、文字輝度画素PYcが抽出されたフレームを表す文字フレーム情報Fcが生成される。文字表示フレームテーブル記憶メモリ014は、文字フレーム情報Fcに基づいて、文字輝度画素PYcが抽出されたフレームを登録する。言い換えれば、文字画素座標情報Cpは文字表示画素テーブル記憶メモリ013に格納され、文字フレーム情報Fcは文字表示フレームテーブル記憶メモリ014に格納される。
次に、図7を参照して、上述の高輝度値画素検索サブルーチン#200における動作を詳細に説明する。高輝度値画素検索サブルーチン#200が開始すると、先ず、
ステップS202において、上述の輝度閾値Vthが設定される。好ましくは、ユーザがリモコンなどの入力手段を用いて、適切な値を入力する。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、予め決めておいた輝度閾値Vthを格納しておく手段から、供給されるように構成しても良い(図1)。そして、制御は次のステップS204に進む。
ステップS204において、映像ストリームSvcの輝度信号Yの全ての輝度画素PY(x,y)に対して、文字輝度画素PYcであるかを判別する文字輝度画素検出処理を施す順番が決定されると共に、決定された順番に処理を施す輝度画素PY(x,y)が1つずつ選択される。好ましくは、選択された輝度画素PY(x,y)毎に、文字輝度画素検出処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象を更新する。そして、制御は次のステップS206に進む。
ステップS206において、輝度画素PY(x,y)の座標値(x,y)を、上述のステップS104において指定された探索範囲Rs或いは非探索範囲Rscを表す座標値(x,y)と比較して、輝度画素PYが探索範囲Rs内或いは非探索範囲Rsc内であるか否かが判断される。Yesの場合、制御は次のステップS208に進む。
ステップS208において、輝度画素PY(x,y)の輝度値VYが輝度閾値Vthより大きいか否かが判断される。Yes、つまり輝度画素PY(x,y)が文字輝度画素PYcであると判断される場合、制御は次のステップS210に進む。
ステップS210において、文字輝度画素PYcであると判断された輝度画素PY(x,y)の座標(x,y)に基づいて、文字画素座標情報Cpが生成される。そして、制御は次のステップS212に進む。
ステップS212において、文字輝度画素PYcと判断された輝度画素PY(x,y)が含まれるフレームの識別子に基づいて、文字フレーム情報Fcが生成される。そして、制御は次のステップS214に進む。
なお、上述のステップS206およびステップS208においてNoと判断される場合は、制御は、ステップS208、S210、およびS212の処理をスキップして、直接ステップS214に進む。
ステップS214において、ステップS204において、検索対象として設定された全ての輝度画素PY(x,y)のうちで、検索がされていないものが残っているか否かが判断される。具体的には、現在の検索対象の輝度画素PYのx、y座標の値が、ステップS204で設定された最大値より小さいか否かが判断される。Yesの場合、制御はステップS204に戻って、次のラスタスキャン順位にある輝度画素PYが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。
ステップS214でYes、つまり、現フレームの輝度信号Yに対して文字輝度画素PYcの認識が完了した時点で、制御は次のステップS216に進む。
ステップS216において、ステップS210およびステップS212において、全輝度画素PYに関して生成された、認識された文字輝度画素PYcを表す文字画素座標情報Cpおよび文字フレーム情報Fcがそれぞれ文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014に記録される。すなわち、文字輝度画素PYcが文字表示画素テーブル記憶メモリ013に登録され、そのフレームが文字表示フレームテーブル記憶メモリ014に登録される。そして、高輝度値画素検索サブルーチン#200を終了して、制御は同一色検索サブルーチン#300に進む。
なお、上述のように、フレームの全ての輝度画素PYに対する文字輝度画素検出処理の完了後に、文字画素座標情報Cpおよび文字フレーム情報Fcを完成させて登録するのではなく、文字輝度画素PYcが検出される毎に、文字画素座標情報Cpおよび文字フレーム情報Fcとして文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014に登録しても良い。
同一色検索サブルーチン#300は、一般的に緊急ニュースなどの文字情報Icは同一色で表示される特徴に基づいて、高輝度値画素検索サブルーチン#200における輝度閾値Vthに基づいて検出した文字輝度画素PYcに対して、同一色(色差の程度)というフィルタを適用して、文字情報Icの認識精度を上げるものである。なお、本発明においては、同一色であるか否かは、色差Cb信号および色差Cr信号の何れに基づいても同様に、判断される。よって、冗長をさけるために、本明細書においては、色差Cb信号に基づく説明をもって、色差Cr信号に基づく説明を省略する。
図8を参照して、同一色検索サブルーチン#300に処理について、具体的に説明する。図8は、色差Cbフレームメモリ006に格納されている色差Cb信号であって、図4の画像における文字情報Icの「A」を含む部分の色差Cb画面画像Icbを拡大して示すと共に、色差Cb画面画像Icbの水平方向のラインLn上の色差Cb分布Dcbを示している。
色差Cb画面画像Icbは、基づく信号が色差Cb信号である点を除いて、上述の輝度画面画像IYと同様に構成されている。つまり、色差Cb画面画像Icbにおいて、一つ一つの升目が、色差Cb画面画像Icbの色差Cb画素Pcb(x,y)を示している。xおよびyは、それぞれ色差Cb画面画像Icbにおける水平方向の座標、および垂直方向の座標を示す。
また、色差Cb分布Dcbにおいて、縦軸はラインLn上の色差Cb画素Pcb(x,y)の色差Cb値Vcbを示し、横軸はラインLn上の色差Cb画素Pcb(x,y)を示している。なお、説明の便宜上、必要に応じて、文字情報Icを表示する色差Cb画素を色差Cb文字画素PcbCと呼び、ストリームSvを表示する色差Cb画素を色差Cbストリーム画素PcbSと呼び、それぞれを識別すると共に、両者を色差Cb画素PCbと総称する。同様に、色差Cb文字画素PcbCおよび色差Cbストリーム画素PCbSの色差値Vcbをそれぞれ、文字色差Cb値VcbCおよびストリーム色差Cb値VcbSと識別する。
本例においては、ラインLnは文字情報Icの「A」の上部を横切っている。文字情報Icが同一色で表示されているとすれば、ステップ#200で登録された文字輝度画素PYcに対応する色差Cb画素Pcbの色差Cb値VcbCの平均値は、文字表示色とほぼ同様の値を持つ。よって、文字の表示色は、高輝度値画素検索サブルーチン#200で登録された、全ての色差Cb画素PcbのCb色差値Vcbの平均値±誤差αの範囲内に収まるはずであるので、この範囲外となった、色差Cb画素Pcb(x,y)に対応する文字輝度画素PYc(x,y)を文字表示画素テーブル記憶メモリ013から登録削除する。なお、αは任意の許容量であり、入力される映像ストリームSvcや映像処理装置Avpに関して、適切に決定される。このようにして、高輝度値画素検索サブルーチン#200による文字輝度画素PYcの検出に基づく、文字情報Icの認識精度の向上を図っている。しかしながら、本高輝度値画素検索サブルーチン#200の処理が、本発明における文字情報Ic認識に不可欠と言う訳ではない。
次に、図9を参照して、上述の同一色検索サブルーチン#300における動作について、色差Cbフレーム画像を例に詳細に説明する。なお、色差Crフレーム画像の場合も、色差Cbフレーム画像の場合と同様であるので、説明を省く。
同一色検索サブルーチン#300が開始すると、先ず、
ステップS302において、同一色検索を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「同一色検索を行うか」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、同一色検索を行うか否かを予め決めておいても良い。そして、制御は次のステップS304に進む。
ステップS304において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、色差Cb画面画像Icbにおいて、文字画素座標情報Cpに記録されている文字画素Pc輝度信号Y(x,y)に対応する色差Cb画素Pcb(x,y)が特定される。そして、制御は次のステップS306に進む。
ステップS306において、特定された全ての色差Cb画素Pcb(x,y)のCb色差値Vcbが検出される。そして、検出されたCb色差値Vcbの平均値である平均Cb色差値Vcb(mean)が算出される。そして、制御は次のステップS308に進む。
ステップS308において、上述の誤差αに基づいて、2つの同一色差Cb閾値Vcb1、およびVcb2が次式(1)および(2)に従って生成される。
Vcb1=Vcb(mean)−α ・・・・(1)
Vcb2=Vcb(mean)+α ・・・・(2)
そして、制御は次のステップS310に進む。
ステップS310において、ステップS304で特定された全ての色差Cb画素Pcbに対して、同一色であるかを判断する同一色判定処理を施す順番が決定されると共に、決定された順番に色差Cb画素Pcb(x,y)が1つずつ選択される。好ましくは、設定された色差Cb画素Pcb(x,y)毎に、同一色判定処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象が選択される。そして、制御は次のステップS312に進む。
ステップS312において、ステップS310で選択された色差Cb画素Pcb(x,y)のCb色差値Vcbが、同一色差Cb閾値Vcb1より大きく、且つ同一色差Cb閾値Vcb2より小さいか否かが判断される。No、つまり、当該色差Cb画素Pcb(x,y)は、文字情報Icを表す色差Cb文字画素PcbCではないと判断場合、制御は次のステップS314に進む。
ステップS314において、文字画素座標情報Cpが補正される。具体的には、文字画素座標情報CpからステップS312において、色差Cb文字画素PcbCではないと判断された色差Cb画素Pcb(x,y)に相当する文字輝度画素PYcの(x,y)座標が文字画素座標情報Cpから削除されるように、文字画素座標情報Cpが補正れる。そして、制御は次のステップS316に進む。
ステップS316において、ステップS304において、検索対象として特定された全ての色差Cb画素Pcb(x,y)のうちで、検索がされていないものが残っているか否かが判断される。具体的には、現在の検索対象の色差Cb画素Pcbの(x,y)座標の値が、ステップS304で設定された最大値より小さいか否かが判断される。Yesの場合、制御はステップS312に戻って、次のラスタスキャン順位にある色差Cb画素Pcb(x,y)が選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。
ステップS316でYes、つまり、現フレームの色差Cb信号に対して同一色検索処理が完了した時点で、制御は次のステップS318に進む。
ステップS318において、ステップS316で補正された文字画素座標情報Cpに基づいて、必要であれば、文字フレーム情報Fcが補正される。具体的には、色差Cb文字画素PcbCではないと判断された色差Cb画素Pcb(x,y)に対応する文字輝度画素PYcの削除により、文字フレーム情報Fcに登録されているフレームに含まれる文字輝度画素PYcが文字画素座標情報Cpに登録されなくなった時に、当該フレームが文字フレーム情報Fcから登録削除される。そして、同一色検索サブルーチン#300の処理が終了する。
一方、上述のステップS302において、Noと判断される場合には、制御は上述のステップS302〜S318をスキップして、つまり同一色検索サブルーチン#300にお同一色判定処理を実行することなく、次の文字表示領域認識サブルーチン#400に進む。
また、ステップS312においてYes、つまり、色差Cb画素Pcb(x,y)は、色差Cb文字画素PcbCであると判断される場合、制御は文字画素座標情報Cpを補正するステップS314をスキップしてステップS316に進む。そして、ステップS318を経て、同一色検索サブルーチン#300の処理を終了して、制御は文字表示領域認識サブルーチン#400に進む。
文字表示領域認識サブルーチン#400は、一般的に緊急ニュースなどの文字情報Icは画面上である限定された領域に密集して表示される特徴に基づいて、さらに文字情報Icの認識精度の向上を図るものである。簡単に言えば、上述の処理において、文字画素Pcとして検出された画素Pの内で、他の文字画素Pcと相対的に離れた位置に存在する画素を抽出して、文字画素座標情報Cpから文字画素としての登録を削除するものである。なお、ここでいう文字画素Pcとは、高輝度値画素検索サブルーチン#200で登録された文字輝度画素PYcおよび、同一色検索サブルーチン#300で登録された色差Cb文字画素PcbCの何れであっても良い。
よって、今後、特に対象文字画素Pcの種類に限定する必要が内場合には、文字表示画素テーブル記憶メモリ013に登録されている文字情報Icを表す画素Pを、全て文字画素Pcと総称して説明する。つまり、本例においては、文字表示画素テーブル記憶メモリ013に登録されている文字輝度画素PYcおよび色差Cb文字画素PcbC(PcrC)を文字画素Pcと総称する。
図10を参照して、文字表示領域認識サブルーチン#400における処理の基本的な考え方について説明する。図10は、文字情報Icが「ABCDEFGHI」ではなく、「ABCDEFGHIJKLMN」と「OPQRSTUVWXYZ」とが2段に表示されていると共に、ノイズNが表示されている点を除いて、基本的に図2に例示した画面画像Iと同じである。なお、文字情報Icが表示されている範囲を、文字表示領域Ricと呼ぶ。このような画面画像Iにおいて、ノイズNの輝度値VYが輝度閾値Vth大きい場合(ステップS208でYes)、さらにCb色差値VcbおよびCr色差値Vcrが所定閾値内である場合(ステップS312でYes)の場合には、ノイズNは文字情報Icとして誤認識されてしまう。つまり、ノイズNを構成する画素Pは、文字画素Pcとして誤って文字表示画素テーブル記憶メモリ013、および/或いは文字表示フレームテーブル記憶メモリ014に登録されてしまう。文字表示領域認識サブルーチン#400では、このような誤認識を以下のようにして防止する。
ノイズNと文字情報Icとは、以下のようにして識別される。つまり、文字表示画素テーブル記憶メモリ013に登録されている全ての文字画素Pc(文字輝度画素PYc、色差Cb文字画素PcbC)の内の1つと、他の全ての文字画素Pcとの距離の総和“L”を算出する。このLを個々の文字画素Pcの他画素間総距離Lと呼ぶ。この他画素間総距離Lに基づいて、特定の文字画素Pcが文字表示領域Ricに対してどの程度離れた位置に表示されているかを判定する。次に、他画素間総距離Lの平均値である平均他画素間総距離L(mean)に比べて極端に大きな値の他画素間総距離Lを持つ文字画素Pcは、文字情報Icを表すものではないとして、文字表示画素テーブル記憶メモリ013に格納されている文字フレーム情報Fcから削除される。
次に、図11を参照して、文字表示領域認識サブルーチン#400における動作を詳細に説明する。文字表示領域認識サブルーチン#400が開始すると、先ず、
ステップS402において、文字表示領域認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字表示領域認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め文字表示領域認識を行うか否かを決めておいても良い。そして、制御は次のステップS404に進む。
ステップS404において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pc(x,y)が特定される。そして、制御は次の本ステップS406に進む。
ステップS406において、ステップS404で特定された全ての文字画素Pc(x,y)に対して、他画素間総距離Lを求める順番が決定されると共に、決定された順番に文字画素Pcを1つずつ選択される。そして、制御は次のステップS408に進む。
ステップS408において、ステップS406で選択された文字画素Pcに関して他r画素間総距離Lが算出される。そして、制御は次のステップS410に進む。
ステップS410において、ステップS404において、領域確認対象として特定された全ての文字画素Pcのうちで、他画素間総距離Lが算出されていないものが残っているか否かが判断される。Yesの場合、制御はステップS406に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、他画素間総距離Lが算出された時点で、制御は次のステップS412に進む。
ステップS412において、平均他画素間総距離L(mean)が算出される。そして、制御は次のステップS414に進む。
ステップS414において、ステップS406におけるのと同様に、他画素間総距離Lを平均他画素間総距離L(mean)と比較する文字画素Pcが選択される。そして、制御は次のステップS416に進む。
ステップS416において、他画素間総距離Lが平均他画素間総距離L(mean)より、所定距離γだけ小さいか否かが判断される。なお、γは、映像ストリームSVcの画質等によって適宜決められる距離である。No、つまり文字画素Pcは文字情報Icでは無いと判断される場合、制御は次のステップS418に進む。
ステップS418において、文字画素座標情報Cpが補正される。具体的には、文字画素座標情報CpからステップS416において、文字情報Icではないと判断された文字画素Pcの(x,y)座標が、文字画素座標情報Cpから削除される。そして、制御は次のステップS420に進む。
ステップS420において、ステップS410におけるのと同様に、ステップS414において、比較として選択される全ての文字画素Pcのうちで、平均他画素間総距離L(mean)との比較が行われていないものが残っているか否かが判断される。Yesの場合、制御はステップS414に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、平均他画素間総距離L(mean)との比較が行われた時点で、制御は次のステップS422に進む。
ステップS422において、ステップS418において補正されて文字画素座標情報Cpに基づいて、必要であれば、上述のステップS316におけるのと同様に文字フレーム情報Fcが補正される。そして、文字表示領域認識サブルーチン#400の処理が終了する。
次に、図12を参照して、文字線幅認識サブルーチン#500における処理の基本的な考え方について説明する。文字線幅認識サブルーチン#500は、一般的に文字は一定の文字線幅で描かれる特徴に基づいて、文字画素Pcの水平および垂直方向への出現の連続性から文字の線幅を抽出し、極端にかけ離れた連続値を持つ文字画素Pcを文字情報Icではないと判断して、文字画素座標情報Cpから登録削除することで、文字認識の精度のなおさらなる向上をはかるものである。
図12に、図4に示した画面画像Iにおける文字情報Icの「D」を含む限定領域Rcが拡大表示されていると共に、文字画素Pcの連続値分布Dcを示す。同図に示されるように文字はある一定の文字線幅Cwlで描画される。よって、水平または垂直方向への文字登録画素の連続値分布Dcは、文字線幅Cwlの値の付近に集中する。仮に連続値Cが文字線幅Cwlより大きい場合でも、文字は一文字一文字独立しているので、文字サイズ幅Cw以上となることはない。また、この文字サイズ幅Cwはフォントにもよるが、一般的に文字線幅Cwlの数倍〜数十倍程度である。よって、連続値Cが文字線幅Cwlより極端に大きな連続値Cを持つ文字画素Pcは文字情報Icでないと判断して、文字画素座標情報Cpから登録削除する。
図13に示すフローチャートを参照して、文字線幅認識サブルーチン#500における動作の詳細を説明する。文字線幅認識サブルーチン#500が開始すると、先ず、
ステップS502において、文字線幅認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字線幅認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームSvcの種類と文字情報Icの種類の組み合わせにおいて、予め文字線幅認識を行うか否かを決めておいても良い。そして、制御は次のステップS504に進む。
ステップS504において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pcが特定される。そして、制御は次の本ステップS506に進む。
ステップS506において、ステップS504で特定された文字画素Pcに対して、文字線幅認識処理を施す順番が決定されると共に、決定された順番に文字画素Pcを1つずつ選択される。好ましくは、設定された文字画素Pc毎に、同一色判定処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、検索対象が選択される。そして、制御は次のステップS508に進む。
ステップS508において、ステップS506で選択された文字画素Pcに対して、水平方向の連続値Chをカウントする。そして、制御は次のステップS510に進む。
ステップS510において、ステップS506で選択された文字画素Pcに対して、垂直方向の連続値Cvがカウントされる。そして、制御は次のステップS512に進む。
ステップS512において、ステップS504において、特定された全ての文字画素Pcのうちで、連続値Chおよび連続値Cvがカウントされていないものが残っているか否かが判断される。Yesの場合、制御はステップS506に戻って、次の文字画素Pcが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、連続値Chおよび連続値Cvがカウントされた時点で、制御は次のステップS514に進む。
ステップS514において、ステップS508でカウントされた連続値Chの平均をとって、文字サイズ幅Cwlが求められる。そして、制御は次のステップS516に進む。
ステップS516において、ステップS510でカウントされた連続値Cvの平均をとって、文字サイズ幅Cwが求められる。そして、制御は次のステップS518に進む。
ステップS518において、連続値Chが文字線幅Cwlより極端に大きいか否かが判断される。なお、この極端の程度は、映像ストリームSVcおよび文字情報Icに基づいて、適宜決定される。Yes、つまり文字画素Pcは、文字サイズ幅Cwlの観点からみれば文字情報Icに対応するものでは無いと判断される場合、制御は次のステップS520に進む。
ステップS520において、文字画素Pcが文字画素座標情報Cpから登録削除される。そして、制御はステップS522に進む。
ステップS522において、連続値Cvが文字サイズ幅Cwより極端に大きいか否かが判断される。なお、この極端の程度は、映像ストリームSVcおよび文字情報Icに基づいて、適宜決定される。Yes、つまり文字画素Pcは文字線幅Cwlおよび文字サイズ幅Cwの両方の観点から、文字情報Icに対応するものでは無いと判断される場合、制御は次のステップS524に進む。
ステップS524において、文字画素Pcが文字画素座標情報Cpから登録削除される。なお、本ステップにおいて削除される前に、ステップS520において、文字画素Pcは既に文字画素座標情報Cpから削除されているので、処理の重複を避ける為に本ステップは省略しても良い。しかしながら、当該文字画素Pcに対する文字線幅確認の精度を確保する為には、本ステップを残すことにより、文字画素Pcが文字線幅Cwlおよび文字サイズ幅Cwの両方の観点から文字情報Icに対応するものでは無いとの判定結果を文字画素座標情報Cpに記録することによって、より高精度な文字情報Icの認識および加工を可能にする。そして、制御はステップS530に進む。
上述のステップS522においてNo、つまり文字画素Pcは、文字線幅Cwlの観点からは文字情報Icに対応するものと判断さ、文字サイズ幅Cwの観点からも文字情報Icに対応するものであると判断される場合、制御はステップS524をスキップして、ステップS530に進む。
また、上述のステップS518においてNo、つまり文字画素Pcは文字サイズ幅Cwlの観点からみれば文字情報Icに対応するものであると判断される場合、制御はステップS526に進む。
ステップS526において、ステップS522におけるのと同様に、連続値Cvが文字サイズ幅Cwより極端に大きいか否かが判断される。Yes、つまり文字画素Pcは、文字線幅Cwlの観点からみれば文字情報Icと判断されるが、文字サイズ幅Cwの観点からは、文字情報Icでは無いと判断される場合、制御は次のステップS528に進む。
ステップS528において、文字画素座標情報Cpから文字画素Pcが文字画素座標情報Cpから登録削除される。なお、本ステップにおいては、文字画素座標情報Cpには文字画素Pcが、文字線幅Cwlの観点からは文字情報Icであると判断されるが、文字サイズ幅Cwの観点からは文字情報Icではないと判断されることも記録することによって、より高精度な文字情報Icの認識および加工を可能にする。
ステップS530において、上述のステップS520、S524、およびS530のぞれぞれで補正された文字画素座標情報Cpに基づいて、文字フレーム情報Fcが補正される。そして、文字線幅認識サブルーチン#500の処理は終了する。なお、上述のステップS502においてNoの場合は、制御はステップS502〜S530をスキップして、文字線幅認識処理を行わないで、文字縁取り認識サブルーチン#600に進む。
次に、図14および図15を参照して、文字縁取り認識サブルーチン#600における処理について説明する。文字縁取り認識サブルーチン#600は、文字の表示方法として頻繁に用いられる一定色で、各文字が縁取られて表示される文字情報Icを認識するものである。図14に、図4に示した文字情報Icの「C」を含む限定領域を拡大して示す。同図に例示するように、一般的に文字を縁取りする際に、その縁取り画素Poの色は同一である。即ち、縁取り部分に位置する画素P(x,y)の輝度値VY、色差Cbおよび色差Crのそれぞれの値は同一である。いいかえれば、輝度値VY、色差Cbおよび色差Crのそれぞれの値が同一の画素P(x,y)は、縁取り画素Poの可能性が非常に高い。
よって、文字表示画素テーブル記憶メモリ013に登録されている文字画素Pcの周辺に位置する画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrの値がそれぞれ同一であるかどうかを判定し、ある一定割合以上の周辺画素P(x,y)が同一の輝度値VY、色差Cb、色差Crを持つ場合は、文字が縁取り表示されていると認識する。なお、周辺に位置する画素P(x,y)とは、文字画素Pcの水平そして垂直方向の正負方向に、それぞれ最も近接する文字画素Pcではない4つの画素P(x,y)を言う。
そして、文字表示画素テーブル記憶メモリ013に、文字の表示方法として縁取りが用いられている事を記憶する。この場合、好ましくは、検出された縁取り画素Poの座標(x,y)も文字画素座標情報Cpの一部として記録される。抽出された縁取り画素Poの縁取り色で周辺画素が描画されていない文字画素Pcの登録を削除することで文字情報Icの認識精度をさらに向上させる。文字画素の誤検出を低減させる。
図15を参照して、文字縁取り認識サブルーチン#600における詳細な動作について説明する。文字縁取り認識サブルーチン#600が開始すると、先ず、
ステップS602において、文字の縁取認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「文字の縁取認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め文字縁取確認を行うか否かを決めておいても良い。そして、制御は次のステップS604に進む。
ステップS604において、文字表示画素テーブル記憶メモリ013から文字画素座標情報Cpが読み出され、同文字画素座標情報Cpに基づいて、文字画素Pcが特定される。そして、制御は次の本ステップS606に進む。
ステップS606において、ステップS604において特定された文字画素Pcの周辺画素Ppの座標(x,y)が特定される。さらに、特定された周辺画素Ppの総数Nppが算出される共にカウンタCtがゼロにセットされる。なお、上述のように、本例においては、文字画素Pcの水平そして垂直方向の正負方向に、それぞれ最も近接する文字画素Pcではない4つの画素P(x,y)が周辺画素Ppとして特定される。そして、制御は次のステップS608に進む。
ステップS608において、ステップS606で特定された周辺画素Ppに対して、縁度認識処理を施す順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。好ましくは、設定された周辺画素Pp毎に、縁取認識処理が終了するたびに、xおよびyの値をラスタスキャンの順番にカウントアップして、次の周辺画素Ppが選択される。そして、制御は次のステップS610に進む。
ステップS610において、周辺画素Ppの輝度値VY、色差値VCb、および色差値VCrが検出さられる。そして、制御は次のステップS612に進む。
ステップS612において、ステップS606において、特定された全ての周辺画素Ppのうちで、輝度値VY、色差値VCb、および色差値VCrが検出されていないものが残っているか否かが判断される。Yesの場合、制御はステップS608に戻って、次の周辺画素Ppが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての文字画素Pcに関して、連続値Chおよび連続値Cvがカウントされた時点で、制御は次のステップS614に進む。
ステップS614において、求められた全ての輝度値VY、色差値VCb、および色差値VCrそれぞれの平均をとって、平均輝度値VY(mean)、平均色差値VCb(mean)、および平均色差値VCr(mean)が求められる。そして、制御は次のステップS615に進む。
ステップS615において、ステップS608におけるのと同様に、但し、周辺画素Ppが同一色で表示されているか否かを判断する順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。そして、制御は次のステップS616に進む。
ステップS616において、ステップS615において選択された周辺画素Ppに関して、輝度値VY、色差Cb値信号、および色差値VCrのそれぞれが、平均輝度値VY(mean)、平均色差値VCb(mean)、および平均色差値VCr(mean)と同程度の値を有するか否かが判断される。なお、同程度の度合いは、映像ストリームSVcおよび文字情報Ic、さらに縁取に応じて、適宜決められる。Yes、つまり当該周辺画素Ppは縁取り画素Poであると判断される場合、制御は次のステップS618に進む。
ステップS618において、カウンタCtが1だけインクリメントされる。そして、制御は次のステップS620に進む。
ステップS620において、ステップS612におけるように、但し、ステップS615において選択された周辺画素Ppのうちで、縁取り画素Poであるかの判断が下されていないものが残っているか否かが判断される。Yesの場合、制御はステップS615に戻って、次の周辺画素Ppが選択される。以降、本ステップでNoと判断されるまで、上述の処理が繰り返される。そして、No、つまり全ての周辺画素Ppが縁取り画素Poであるか否かの判断が成された時点で、制御は次のステップS618に進む。
一方、上述のステップS616においてNo、つまり当該周辺画素Ppは縁取り画素Poでないと判断される場合、ステップS618およびステップS620をスキップして、制御はステップS615に戻る。
ステップS622において、ステップS618で求められたカウンタCtの値を、周辺画素Ppの総数Nppで除算して、同一色で表示されている周辺画素Ppの同一色割合Dを求める。そして、制御は次のステップS624に進む。
ステップS624において、ステップS615におけると同様に、但し、周辺画素Ppが縁取画素であるか否かを判断する順番が決定されると共に、決定された順番に周辺画素Ppが1つずつ選択される。そして、制御は次のステップS626に進む。
ステップS626において、ステップS622で求められた同一色割合Dが、割合閾値Dthより小さいか否かが判断される。なお、割合閾値Dthは、映像ストリームSVc、文字情報Ic、および縁取りの状態に応じて、適宜決められる。そして、制御は次のステップS628に進む。Yes、つまり周辺画素Ppは縁取り画素Poでは無いと判断される場合、制御は次のステップS628に進む。
ステップS628において、当該周辺画素Ppに対応する周辺画素Ppが、文字画素座標情報Cpから登録削除される。そして、制御は次のステップS630に進む。
ステップS630において、周辺画素Ppが文字画素座標情報Cpとして文字表示画素テーブル記憶メモリ013に登録される。そして、制御は次のステップS632に進む。
ステップS632において、文字画素座標情報Cpに基づいて、文字フレーム情報Fcが適宜補正される。そして、制御は次のステップS634に進む。
ステップS634において、ステップS624において選択される、全ての周辺画素Ppで縁取画素であるか否かが判断されていないものが残っているか否かが判断される。Noの場合制御は、ステップS624にも戻る。
上述のステップS626でNoと判断される場合、制御はステップS628、S630、S632、およびS634をスキップして、ステップS624に戻る。
ステップS634において、Noと判断されたときに文字縁取り認識サブルーチン#600の処理は終了する。
次に、図16および図17を参照して、点滅表示認識サブルーチン#700における処理について説明する。点滅表示認識サブルーチン#700は 文字の表示方法として頻繁に用いられる、消去と表示を一定時間毎に繰り返して、各文字が点滅表示される文字情報Icを認識するものである。図16に、左か右へと時間の経過と共に、3つの画面画像Ib1、Ib2、およびIb3が示されている。画面画像Ib1には文字情報Icが表示されており、画面画像Ib2には文字情報Icが表示されておらず、画面画像Ib3には画面画像Ib1と同様に文字情報Icが表示されている。点滅表示では時間軸方向に対して、画面画像Ib1および画面画像Ib2のように文字情報Icが表示さる文字表示区間P1と文字消去区間P2とが交互に出現し、且つ時間軸上のどこにおいても文字表示区間P1と文字消去区間P2との時間的長さ、つまり期間はそれぞれ一定である。
図17に示すフローチャートを参照して、点滅表示認識サブルーチン#700の動作の詳細を説明する。点滅表示認識サブルーチン#700が開始すると、先ず、
ステップS702において、点滅表示認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「点滅表意認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め点滅表意認識を行うか否かを決めておいても良い。そして、制御は、次のステップS704に進む。
ステップS704において、文字表示フレームテーブル記憶メモリ014から文字フレーム情報Fcが読み出される。そして、制御は次のステップS706に進む。
ステップS706において、文字フレーム情報Fcに基づいて、文字表示フレームテーブル記憶メモリ014に登録されたフレームの連続性から、文字表示区間P1が検出される。そして制御は、次のステップS708に進む。
ステップS708において、文字フレーム情報Fcに基づいて、文字表示フレームテーブル記憶メモリ014に登録されたフレームの連続性が途切れている間の時間から文字消去区間P2が検出される。そして制御は、次のステップS710に進む。
ステップS710において、文字情報Icは点滅表示であるか否かが判断される。具体的には、ステップS706とステップS708においてそれぞれ検出された文字表示区間P1と文字消去区間P2が所定値を持っている場合、点滅表示と判断される。そして、制御は、次のステップS712に進む。
ステップS712において、文字情報Icは点滅表示であることが文字フレーム情報Fcに記憶される。そして制御は、点滅表示認識サブルーチン#700の処理が終了する。
なお、ステップS710において、文字情報Icは点滅表示ではないと判断される場合、制御はステップS712をスキップして、点滅表示認識サブルーチン#700の処理が終了する。同様に、ステップS702においてNoの場合、制御はステップS704〜S710をスキップして、点滅表示認識サブルーチン#700の処理が終了する。
次に、図18および図19を参照して、移動表示認識サブルーチン#800について説明する。移動表示認識サブルーチン#800は、文字の表示方法として頻繁に用いられる、文字情報Icが一定の速度で水平または垂直方向に移動する移動表示を認識する処理である。図18に、移動表示であるフレームで表示された文字画素が時間軸の進行方向に対し水平に移動して表示される様子を示す。すなわち、ある時間におけるフレームN上の文字情報Icは、フレームN±β(βは任意の正の整数)における文字画素Pcを水平または垂直方向にβフレーム分移動させたものに一致するはずである。
すなわち、文字表示画素テーブル記憶メモリ013に登録されているフレームNの文字画素Pcの分布と、文字表示画素テーブル記憶メモリ013に登録されたフレームN±βにおける文字画素Pcの位置を水平または垂直方向にβフレーム分ずらしたものの分布が一致する場合、文字情報Icは移動表示されていると認識すると共に、文字情報Icがβフレーム分移動表示されていることを文字表示画素テーブル記憶メモリ013に記憶する。
次に、図19を参照して、移動表示認識サブルーチン#800の動作について詳細に説明する。移動表示認識サブルーチン#800の動作が開始すると、先ず、
ステップS802において、移動表示認識を行うか否かが判断される。好ましくは、ユーザに対して、モニタに「移動表示認識を行うか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、映像ストリームの種類と文字情報Icの種類の組み合わせにおいて、予め移動表示認識を行うか否かを決めておいても良い。Yesの場合、制御は次のステップS804に進む。
ステップS804において、文字画素座標情報Cpおよび文字フレーム情報Fcがそれぞれ文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から読み出される。そして、制御は、次のステップS806に進む。
ステップS806において、文字画素座標情報Cpおよび文字フレーム情報Fcに基づいて、フレームN(Nは任意の正の整数)の、文字画素Pcの画面画像Iにおける画素分布Dnを求める。そして、制御は次のステップS808に進む。
ステップS808において、フレームN±βにおける文字画素Pcの画面画像Iにおける画素分布Dβを求める。正確に言えば、フレームNに対してβフレーム分だけ前の画素分布Dβ−と、フレームNに対してβフレーム分だけ後の画素分布Dβ+の2種類が存在するが、紙面および説明の便宜上、画素分布Dβ−と画素分布Dβ+とを画素分布Dβと総称する。そして、制御は次のステップS810に進む。
ステップS810において、次式(3)に基づいて、フレームNにおける画面画像Inにおける文字情報Icが最大動き得る量を表す移動係数dが算出される。
d = − ρ + △ρ ・・・・ (3)
移動量ρは、画面画像Inにおける画素解像度に対応する移動量、Δρは、画面画像Inにおける画素解像度に対応する最小移動量。そして、制御は次のステップS812に進む。
ステップS812において、ステップS804で求めた画素分布Dnに基づいて、フレームNに対して移動係数dだけ移動した時の画素分布Dn(d)が算出される。そして制御は、次のステップS814に進む。
ステップS814において、ステップS812で求めた画素分布Dn(d)がステップS808で求められた画素分布Dβと一致するか否かが判断される。具体的には、画素分布Dβから画素分布Ddを減じた値が0になるか否かが判断される。Yes、つまり一致する(減算結果が0の)場合、制御は次のステップS816に進む。
ステップS816において、文字情報Icが移動表示であることを、文字フレーム情報Fcおよび文字画素座標情報Cpに書き込む。そして、制御は次のステップS818に進む。
一方、上述のステップS814でNo、つまり、画素分布Dn(d)は画素分布Dβと一致しないと判断される場合、制御はステップS816をスキップして、ステップS818に進む。
ステップS818において、ステップS810でΔρずつインクリメントされた移動係数dが移動量ρ以上であるか否かが判断される。No、つまり、画面画像Inにおける文字情報Icの最大移動可能範囲に対する画素分布Dn(d)に関して、画素分布Dβと一致の判断が終わっていないことを意味するので、制御は上述のステップS810に戻る。
Yesの場合、画面画像Inにおける文字情報Icの最大移動可能範囲に対する画素分布Dn(d)に関して、画素分布Dβと一致の判断が終わっていることを意味するので、移動表示認識サブルーチン#800を終了する。
なお、上述の同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800は、事前に文字画素座標情報Cpおよび文字フレーム情報Fcが生成されていれば良い。よって、この意味において、本例においては、先行する高輝度値画素検索サブルーチン#200の後であれば、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800のそれぞれを実施する順番は、必要に応じて変更しても良い。さらに、認識対象である文字情報Icの種類に応じて、同一色検索サブルーチン#300、文字表示領域認識サブルーチン#400、文字認識サブルーチン#500、文字縁取り認識サブルーチン#600、点滅表示認識サブルーチン#700、および移動表示認識サブルーチン#800の内で適当なものを選択して実施しても良い。
次に、図20および図21を参照して、文字加工器012について説明する。文字加工器012は、文字認識器011によって認識された文字情報Icの文字画素Pcに関する情報に基づいて、映像ストリームSVcから文字情報Icに対して種々の処理を施す機能を有する。文字加工器012は、文字情報Icを消去する文字情報消去機能、文字情報Icが点滅表示時に文字情報Icを消去する文字情報消去機能、文字情報Icが移動表示時に文字情報Icを削除する文字情報消去機能、文字情報Icを移動させる文字情報移動機能、文字情報Icを拡大/縮小表示させる文字情報拡倍機能、および文字情報Icを特定の注目領域以外の領域に移動表示させる注目領域回避機能を有する。
図20を参照して、文字加工器012の文字加工の主な動作について説明する。文字認識器011における上述の認識処理を経て、輝度信号Y、色差Cb信号、および色差Cr信号が文字加工器012に入力された時点で、文字加工器012の文字加工処理が開始する。なお、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014には、上述の認識処理結果を反映した状態の文字フレーム情報Fcおよb文字画素Pcが格納されている。
先ず、ステップS1002において、映像ストリームSVcに対して、文字情報Icを消去する文字消去処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報消去処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は次のステップS1004に進む。
ステップS1004において、映像ストリームSVcは、文字情報Icが点滅表示されているか否かが判断される。具体的には、文字フレーム情報Fcおよび文字画素座標情報Cpに、文字情報Icが点滅表示である旨の記録があるか否かに基づいて、判断される。 Noと判断される場合、次のステップS1006に進む。一方、Yesの場合、制御は次の点滅表示時文字情報消去サブルーチン#1100に進む。
点滅表示時文字情報消去サブルーチン#1100において、点滅表示されている文字情報Icが映像ストリームSVcから消去される。これについては、後ほど詳述する。点滅表示時文字情報消去サブルーチン#1100の処理の後、文字加工器012による文字加工処理が終了する。
ステップS1006において、映像ストリームSVcは、文字情報Icが移動表示されているか否かが判断される。具体的には、文字フレーム情報Fcおよび文字画素座標情報Cpに、文字情報Icが移動表示である旨の記録があるか否かに基づいて、判断される。Noの場合、制御は文字消去サブルーチン#1300に進む。一方、Yesの場合、制御は次の移動表示時文字情報消去サブルーチン#1200に進む。
移動表示時文字情報消去サブルーチン#1200において、移動表示されている文字情報Icが映像ストリームSVcから消去される。これについては、後ほど詳述する。移動表示時文字情報消去サブルーチン#1200の処理の後、文字加工器012による文字加工処理が終了する。
文字消去サブルーチン#1300において、文字情報Icが映像ストリームSVcから消去される。これについては、後ほど詳述する。文字消去サブルーチン#1300の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1002においてNo、つまり文字消去処理は実施されない場合、逝去はステップS1008に進む。
ステップS1008において、映像ストリームSVcに対して、文字情報Icを移動する文字移動処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報移動処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。さらに、好ましくは、ユーザが所望の移動量Sを入力するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、文字情報拡倍サブルーチン#1400に進む。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は文字情報移動サブルーチン#1400に進む。
文字情報移動サブルーチン#1400において、文字情報Icが映像ストリームSVcにおいて、その表示場所が変更、つまり文字情報Icが画面画像Iにおいて移動させられる。これについては、後ほど図23を参照して詳述する。文字情報移動サブルーチン#1400の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1008においてNo、つまり文字情報移動処理が行われない場合に、制御はステップS1010に進む。
ステップS1010において、映像ストリームSVcに対して、文字情報Icを拡大/縮小表示させる文字情報拡倍処理を実施するか否かがユーザに対して問い合わされる。好ましくは、ユーザに対して、モニタに「文字情報拡倍処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。さらに、好ましくは、ユーザが所望の拡倍率Mを入力するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、制御は文字情報拡倍サブルーチン#1500に進む。
文字情報拡倍サブルーチン#1500において、文字情報Icが映像ストリームSVcにおいて、拡大表示される。これについては、後ほど図24を参照して詳述する。文字情報拡倍サブルーチン#1500の処理の後、文字加工器012による文字加工処理が終了する。
上述のステップS1010においてNo、つまり、文字情報Icの拡大表示処理が行われない場合、制御はステップS1012に進む。
ステップS1012において、文字情報Icにおける注目領域以外の領域に文字情報Icを移動表示させるか否かが判断される。好ましくは、ユーザに対して、モニタに「注目領域回避処理を実施するか?」のメッセージを表示して、ユーザはリモコンなどの入力手段を用いて、メッセージに応答するように構成される。しかしながら、文字画素Pcおよび文字フレーム情報Fcに基づいて、自動的に判断されるようにしても良い。Yesの場合、注目領域回避サブルーチン#1600に進む。
注目領域回避サブルーチン#1600において、文字情報Icが映像ストリームSVcにおいて、画面画像Iの視聴者が注目し易い領域から、視聴者の気にならない領域に移動させられる。これについては、後ほど図25を参照して詳述する。注目領域回避サブルーチン#1600の処理の後、文字加工器012による文字加工処理が終了する
このように、文字消去を行う場合に、点滅表示認識サブルーチン#700において点滅表示と認識されている場合は、点滅表示時文字情報消去サブルーチン#1100において文字情報Icが消去される。移動表示認識サブルーチン#800において移動表示と認識されている場合は、移動表示時文字情報消去サブルーチン#1200において文字情報Icが消去される。その他の場合は、文字情報消去サブルーチン#1300において文字情報Icが消去される。
また、文字移動を行う場合には、文字情報移動サブルーチン#1400において文字情報Icが移動される。また、文字拡倍を行う場合には、文字情報拡倍サブルーチン#1500において文字情報Icが拡倍される。また、注目領域回避を行う場合には、注目領域回避サブルーチン#1600において非注目領域に文字情報Icが移動されて表示される。
次に、図21および図22を参照して、文字情報消去サブルーチン#1300の動作について説明する。図21に、画面画像Iにおける文字画素Pcを示す。同図において文字画素Pc(x,y)を消去する方法について述べる。文字画素Pc(x,y)の水平または垂直方向の正負方向に最も近傍する、文字画素Pcおよび縁取り画素Poの何れでもない4つの画素Pに基づいて、文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrを線形補間することで文字情報Icを消去する。なお、文字画素Pc(x,y)が縁取り画素Poの場合であっても同様にして、近傍の画素Pに基づいて消去する縁取り画素Poの輝度値VY、色差値VCb、および色差値VCrを補間して消去する。なお、この文字画素Pc或いは縁取り画素Poの補間処理は、文字表示画素テーブル記憶メモリ013に登録されている文字画素座標情報Cpに基づいて行われて、文字情報Icの補間値が算出される。
つまり、文字加工器012は、0011から入力される輝度信号Y、色差Cb信号、および色差Cr信号のそれぞれに対して、求めた補間値を上書きして、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを生成して出力する。 被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTは、それぞれ、出力用メモリ004の被処理輝度フレームメモリ008、被処理色差Cbフレームメモリ009、および被処理色差Crフレームメモリ010に一旦保持された後、後処理器015で映像ストリームSVtに合成される。なお、映像ストリームSVtにおいては、映像ストリームSVcに組み込まれていた文字情報Icは、消去されている。
図22を参照して、文字消去サブルーチン#1300の動作について詳述する。図20に示すフローチャートにおいて、ステップS1006においてNoと判断された時点で、文字消去サブルーチン#1300の動作が開始される。
先ず、ステップS1302において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1304に進む。
ステップS1304において、文字画素座標情報Cpに基づいて、フレーム単位で補間処理をする文字画素Pc(x,y)が選択される。そして、制御は次のステップS1306に進む。
ステップS1306において、上述の方法にて、ステップS1304で選択された文字画素Pcに対する補間輝度値VYt、補間色差値VCbt、および補間色差値VCrtが求められる。そして、制御は次のステップS1308に進む。
ステップS1308において、当該文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ、ステップS1306において求められた補間輝度値VYt、補間色差値VCbt、および色差値VCrtで上書きされる。そして、制御は次のステップS1310に進む。
ステップS1310において、ステップS1302において読み出された文字画素座標情報Cpで規定される、補正対象の文字画素Pc(x,y)の内で、補間輝度値VYt、補間色差値VCbt、および補間色差値VCrtが求められていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1304に戻り、ステップS1304〜ステップS1308における処理が繰り返されて、当該フレームのおける全ての文字画素Pc(x,y)が補間輝度値VYt、色差値VCrt、および補間色差値VCbtによって上書きされて、文字情報Icが画面画像Iから消去される。
このように、文字画素Pc(x,y)が処理された輝度信号Y、色差Cb信号、および色差Cr信号を、それぞれ被処理輝度信号YT、被処理色差Cb信号CbT、被処理色差Cr信号CrTと呼ぶ。本ステップにおいてNoと判断された時点で、制御は次のステップS1312に進む。
ステップS1312において、画素値が書き換えられた文字画素Pc(x,y)に値王する被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが出力用メモリ004に出力される。なお、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTは、後処理器015によって、映像ストリームSVtに合成される。そして、映像ストリームSVtには、映像ストリームSVcにおいて組み込まれていた文字情報Icが消去されていることは上述の通りである。なお、ステップS1306における補間輝度値VYt、補間色差値VCbt、および色差値VCrtの算出の方法を除けば、文字消去サブルーチン#1300は基本的に、点滅表示時文字情報消去サブルーチン#1100および移動表示時文字情報消去サブルーチン#1200にも適用できる。これについては、以下に述べる。
点滅表示時文字情報消去サブルーチン#1100は、点滅表示認識サブルーチン#700によって文字情報Icの表示方法が点滅表示であると認識されている場合のみに選択され得る処理である。文字消去の対象である文字画素Pcまたは縁取り画素Poの輝度値VYと色差値VCbと色差値VCrのそれぞれの補間値として、時間的に最も近接する文字消去区間P2内のフレームにおいて対応する画素P(x,y)の値が用いられる。この処理を文字表示画素テーブル記憶メモリ013に登録された文字画素Pcおよび/或いは、縁取り画素Poにたいして施すことで文字情報Icの補間値(補間輝度値VYt、補間色差値VCbt、色差値VCrt)が算出される。
補間値を求める対象が同一フレームではなく、時間的近接フレームである点を除いて、点滅表示時文字情報消去サブルーチン#1100の動作は、上述の文字情報消去サブルーチン#1300における動作と同様である。また、文字情報消去サブルーチン#1300においても、ステップS1308において、文字情報消去サブルーチン#1300におけるのと同様に、同一フレームではなく、時間的近接フレームから補間値を求めても良い。
文字加工器012によって、文字認識器011から出力された輝度信号Y、色差Cb信号、および色差Cr信号に対して、この算出された補間値(補間輝度値VYt、補間色差値VCbt、色差値VCrt)を上書きして、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを生成して、出力用メモリ004を介して後処理器015に出力される。そして、後処理器015は処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTを合成して、映像ストリームSVtを生成する。この映像ストリームSVtの画面画像Iには、映像ストリームSVcで点滅表示されていた文字情報Icが消去されている。
移動表示時文字情報消去サブルーチン#1200は、移動表示認識サブルーチン#800によって文字情報Icの表示方法が移動表示であると判定された場合のみに選択され得る処理である。文字消去の対象となる文字画素Pcまたは縁取り画素Poの輝度値VY、色差値VCb、および色差値VCrそれぞれの補間値として、対象となる画素が文字画素Pcとして登録されていないフレームのうち、時間的に最も近接するフレームにおいて対応する画素P(x,y)の値が用いられる。以降の動作は、上述の文字消去サブルーチン#1300および点滅表示時文字情報消去サブルーチン#1100におけるのと同様である。結果、後処理器015から出力される映像ストリームSVtの画面画像Iには、映像ストリームSVcで移動表示されていた文字情報Icが消去されている。
以下に、図23を参照して、文字情報移動サブルーチン#1400の動作の詳細について説明する。文字情報移動サブルーチン#1400は、文字情報Icを映像ストリームSvcにおける位置から別の位置に移動させる文字加工器012による処理である。つまり、消去対象とする文字情報Icが点滅表示であっても、移動表示であっても構わない。
先ずステップS1402において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1404に進む。
ステップS1404において、移動させる文字画素Pc(x,y)が選択される。そして、制御は次のステップS1406に進む。
ステップS1406において、当該文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrが注意出される。なお、説明の便宜上、本ステップで抽出されて文字画素Pc(x,y)の輝度値VY、色差値VCb、および色差値VCrをそれぞれ、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)と識別する。すなわち、本ステップにおいては、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出される。そして、制御は次のステップS1408に進む。
ステップS1408において、移動対象である文字画素Pc(x,y)の内で、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出されていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1404に戻り、ステップS1404〜ステップS1406における処理が繰り返されて、移動対象である全ての文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出された後に、本ステップでNoと判断される。そして、制御は次の文字消去サブルーチン#1000に進む。
文字消去サブルーチン#1000は、図22に示した文字消去サブルーチン#1300から、文字画素座標情報Cpおよび文字フレーム情報Fcを読み出すステップS1302を削除したものである。なお、文字消去サブルーチン#1000においては、削除されたステップS1302の変わりに、上述のステップS1402で読み出された文字画素座標情報Cpおよび文字フレーム情報Fcに基づいて、文字削除処理を行う。移動させる文字画素Pc(x,y)が消去された、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが生成される(S1312)。そして、制御は次のステップS1410に進む。
ステップS1410において、文字情報Icの移動先である画素P(x,y)が選択される。この移動先の画素P(x,y)は、ステップS1404で選択されえた移動元の文字画素Pc(x,y)を所定距離分だけ移動させたものに対応する。そして、制御は次のステップS1412に進む。
ステップS1412において、ステップS1410で選択された画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ、ステップS1406において求められた文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされる。そして、制御は次のステップS1414に進む。
ステップS1414において、移動先である画素P(x,y)の内で、輝度値VY、色差値VCb、および色差値VCrが文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)に上書きされていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1410に戻り、ステップS1410〜ステップS1414における処理が繰り返されて、全ての移動先画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrがそれぞれ文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされた後に、本ステップでNoと判断される。そして、制御は次のステップS1416に進む。
ステップS1416において、上述のステップS1312において生成されて、出力用メモリ004に格納されている被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが、ステップS1412で書き換えられた輝度値VY、色差値VCb、および色差値VCrで更新される。そして、更新された被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが後処理器015によって合成されて、文字情報Icが移動した映像ストリームSVtが生成される。
次に、図24を参照して、文字情報拡倍サブルーチン#1500の動作について説明する。文字情報拡倍サブルーチン#1500は、文字加工器012による文字加工処理として文字情報Icを映像ストリームSVcに含まれていた状態から拡大/縮小させて表示する拡倍処理である。
先ずステップS1502において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1504に進む。
ステップS1504において、拡倍させる文字画素Pc(x,y)が選択される。そして、制御は次のステップS1506に進む。
ステップS1506において、当該文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出される。そして、制御は次のステップS1508に進む。
ステップS1508において、拡倍対象である文字画素Pc(x,y)の内で、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出されていないものが残っているか否かが判断される。Yesの場合、制御は上述のステップS1504に戻り、ステップS1504〜ステップS1506における処理が繰り返されて、全ての拡倍対象である文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)が抽出された後に、本ステップでNoと判断される。そして、制御は次の文字消去サブルーチン#1000に進む。
文字消去サブルーチン#1000において、拡倍させる文字画素Pc(x,y)が消去された、被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが生成される(S1312)。そして、制御は次のステップS1510に進む。
ステップS1510において、拡倍された後の文字情報Icに対応する文字画素Pc(x,y)を求める。具体的には、文字情報Icを構成する文字画素Pc(x,y)の座標(x,y)に拡倍量Mを乗算して、拡倍後の文字画素Pc(x×M、y×M)を求める。なお、拡倍量Mは、0より大きな任意の整数である。つまり、拡倍処理によって、拡倍後の文字情報Icの大きさかは、拡倍前より大きくても小さくても良い。そして、制御は次のステップS1512に進む。
ステップS1512において、文字画素Pc(x×M、y×M)に相当する画素P(x×M、y×M)を特定する。そして、制御は次のステップS1514に進む。
ステップS1514において、ステップS1512において特定された画素P(x×M、y×M)の全てに対して、拡倍処理を施す順番を決定すると共に、その順番にしたがって1つずつ選択する。そして、制御は次のステップS1516に進む。
ステップS1516において、ステップS1514において選択された画素P(x×M、y×M)の輝度値VY、色差値VCb、および色差値VCrのそれぞれをステップS1506において抽出された文字画素Pc(x,y)の文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きする。このようにして、元の文字画素Pc(x,y)と同じ輝度および色差を有する画素P(x×M、y×M)によって、文字情報Icが拡大される。そして、制御は次のステップS1518に進む。
ステップS1518において、ステップS1512で特定された画素P(x×M、y×M)の内で、その輝度値VY、色差値VCb、および色差値VCrのそれぞれが、文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きされていないものが残っていないかが判断される。全ての画素P(x×M、y×M)が上書きされて、文字情報Icが拡大された後に制御は次のステップS1520に進む。
ステップS1520において、上述のステップS1312において生成されて、出力用メモリ004に格納されている被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが、ステップS1516で書き換えられた輝度値VY、色差値VCb、および色差値VCrによって更新される。そして、更新された被処理輝度信号YT、被処理色差Cb信号CbT、および被処理色差Cr信号CrTが後処理器015によって合成されて、文字情報Icが移動した映像ストリームSVtが生成される。
なお、拡倍量Mが1より小さい場合には、拡倍処理によって、1つ以上の文字画素Pc(x,y)が、1つの画素P(x×M、y×M)で表現される。よって、文字情報Icのみならず、線幅も縮小される。一方、拡倍量Mが1より大きい場合には、隣接する複数の文字画素Pc(x,y)によって表現されていた線が、拡倍量Mによっては、数個の画素P(x,y)分だけ離間した画素P(x×M、y×M)によって表現される。このような場合、本来1本として表される線が互いに離間した複数の細線或いは、互いに離間した点の集まりとして表現されて、見難いものとになる。このような事態を避けるために、ステップS1518とステップS1520の間に、画素P(x×M、y×M)の間に位置する画素P(x,y)の輝度値VY、色差値VCb、および色差値VCrのそれぞれを文字輝度値VY(c)、文字色差値VCb(c)、および文字色差値VCr(c)で上書きするステップを設けてれば良い。
次に、図25を参照して、注目領域回避サブルーチン#1600の動作について説明する。注目領域回避サブルーチン#1600は、文字加工器012による文字加工処理として、画面画像Iにおいて人間が注目する注目領域と、人間が注目しない背景などの動きの少ない非注目領域を自動的に判別して、非注目領域に文字情報Icを移動させる処理である。なお、文字情報Icの移動は、上述の文字情報移動サブルーチン#1400を利用して行われる。すなわち映像ストリームSvcにおけるそれぞれのフレーム毎に、算出された非注目領域と現在の文字情報Ic領域の距離を算出し、算出された距離だけ文字情報Icを移動させる。
注目領域回避サブルーチン#1600が開始すると、先ず、
ステップS1602において、文字表示画素テーブル記憶メモリ013および文字表示フレームテーブル記憶メモリ014から文字画素座標情報Cpおよび文字フレーム情報Fcが読み出される。そして、制御は次のステップS1604に進む。
ステップS1604において、入力用メモリ003から出力される輝度信号Y、色差Cb信号、および色差Cr信号に基づいて、映像ストリームSVcのフレーム毎に非注目領域が認識される。そして、制御は次のステップS1606に進む。
ステップS1606において、ステップS1604において認識された非注目領域の範囲が算出される。好ましくは、非注目領域は、4点で規定される矩形として認識される。そして、この4点に対応する画素P(x,y)の座標と共に、非注目領域の中心に対応する画素P(x,y)が求められる。なお、説明の便宜上、この非注目領域の中心に対応する画素P(x,y)を非注目領域中心画素Pnnと呼ぶ。そして、制御は次のステップS1608に進む。
ステップS1608において、文字画素座標情報Cpに登録されている全ての文字画素Pc(x,y)と非注目領域中心画素Pnnとの水平方向距離および垂直方向距離のそれぞれの平均値である非注目領域水平移動距離Lhnおよび非注目領域垂直移動距離Lvnが算出される。なお、上述の移動量Sは、非注目領域水平移動距離Lhnおよび非注目領域垂直移動距離Lvnで決定される量である。そして、制御は次の文字情報移動サブルーチン#1400Rに進む。
文字情報移動サブルーチン#1400R、図23に示した文字情報移動サブルーチン#1400から、文字画素座標情報Cpおよび文字フレーム情報Fcを読み出すステップS1402を削除したものである。なお、文字情報移動サブルーチン#1400Rにおいては、削除されたステップS1402の変わりに、上述のステップS1602で読み出された文字画素座標情報Cpおよび文字フレーム情報Fcと、ステップS1608において求められた移動量Sに基づいて、文字情報Icは非注目領域に移動される。
図26を参照して、本発明の実施の形態に係る映像処理装置における記録装置について説明する。記録装置Arは、上述の映像処理装置Avpにより生成された映像ストリームSvtを、記録媒体019に記録する機能を実現する為に、エンコーダ016、記録部017、記録コントローラ018を含む。エンコーダ016は、上述の後処理器015より入力される映像ストリームSvtを記録媒体019への記録に適したデータ形式になるようにエンコードして、記録用映像ストリームSvtrを生成する。記録部017は記録用映像ストリームSvtrを記録媒体019に記録する。なお、記録コントローラ018は、記録装置Arの全体(エンコーダ016および記録部017)の動作を制御する。
この場合、記録コントローラ018は、映像処理装置Avpの後処理器015から映像ストリームSvtを出力させるために、後処理器015の動作を制御しても良い。また、記録装置Arは映像処理装置Avpと一体的に構成することもできる。この場合、記録コントローラ018の機能はシステムコントローラ030に兼任させても良い。
次に、図27を参照して、本発明の実施の形態に係る映像処理装置における再生表示装置について説明する。再生表示装置Apは、上述の映像処理装置Avpにより生成された映像ストリームSvtを映音像として提示する為に、再生部020、表示部021、および再生コントローラ022を含む。再生部020は後処理器015から入力される映像ストリームSvtに基づいて、表示部021による画像表示および発声に適した形式の映音像信号Savを生成する。表示部021は再生部020から入力される映音像信号Savによって、映像或いは音声を提示する。再生コントローラ022は、再生装置Apの全体(再生部020および表示部021)の動作を制御する。
この場合、再生コントローラ022は、映像処理装置Avpの後処理器015から映像ストリームSvtを出力させるために、後処理器015の動作を制御しても良い。また、再生装置Apは映像処理装置Avpと一体的に構成することもできる。この場合、再生コントローラ022の機能はシステムコントローラ030に兼任させても良い
本発明に係る映像処理装置は、映像ストリームに組み込まれた緊急ニュースなどの文字情報の消去、移動、及び拡倍などの加工に用いることができ、さらにDVDレコーダなどの記録装置やモニタなどの表示装置にも適用できる。
本発明の実施の形態に係る映像処理装置の構成を示すブロック図 図1に示した映像処理装置において処理対象である映像ストリームのフレーム画像の一例を表す図 図1に示した映像処理装置の主な文字認識動作を表すフローチャート 図3に示した検索範囲指定サブルーチンにおける検索範囲指定の説明図 図3に示した検索範囲指定サブルーチンにおける動作を表すフローチャート 図3に示した高輝度値画素検索サブルーチンにおける高輝度検索の説明図 図3に示した文字認識サブルーチンにおける動作を表すフローチャート 図3に示した同一色検索サブルーチンにおける同一色検索の説明図 図3に示した同一色検索サブルーチン動作を表すフローチャート 図3に示した文字表示領域認識サブルーチンにおける文字表示領域認識の説明図 図3に示した文字表示領域認識サブルーチンにおける動作を表すフローチャート 図3に示した文字線幅認識サブルーチンにおける文字線幅認識の説明図 図3に示した文字線幅認識サブルーチンにおける動作を表すフローチャート 図3に示した文字縁取り認識サブルーチンにおける文字縁取り認識の説明図 図3に示した文字縁取り認識サブルーチンにおける動作を表すフローチャート 図3に示した点滅表示認識サブルーチンにおける点滅表示認識の説明図 図3に示した点滅表示認識サブルーチンにおける動作を表すフローチャート 図3に示した移動表示認識サブルーチンにおける移動表示認識の説明図 図3に示した移動表示認識サブルーチンにおける動作を表すフローチャート 図1に示した映像処理装置の主な文字加工動作を表すフローチャート 図20に示した文字情報消去サブルーチンにおける文字消去の説明図 図20に示した文字情報消去サブルーチンにおける動作を表すフローチャート 図20に示した文字情報移動サブルーチンにおける動作を表すフローチャート 図20に示した文字情報拡倍サブルーチンにおける動作を表すフローチャート 図20に示した注目領域回避サブルーチンにおける動作を表すフローチャート 本発明の実施の形態に係る映像処理装置における記録装置の構造を示すブロック図 本発明の実施の形態に係る映像処理装置における再生表示装置の構造を示すブロック図
符号の説明
Avp 映像処理装置
Ar 記録装置
Ap 再生装置
002 前処理器
003 入力用メモリ
004 出力用メモリ
005 輝度フレームメモリ
006 色差Cbフレームメモリ
007 色差Crフレームメモリ
008 被処理輝度フレームメモリ
009 被処理色差Cbフレームメモリ
010 被処理色差Crフレームメモリ
011 文字認識器
012 文字加工器
013 文字表示画素テーブル記憶メモリ
014 文字表示フレームテーブル記憶メモリ
015 後処理器
016 エンコーダ
017 記録部
018 記録コントローラ
019 記録媒体
020 再生部
021 表示部
022 再生コントローラ
030 システムコントローラ
040 メモリ

Claims (39)

  1. 入力される映像ストリーム(Svc)に組み込まれた文字情報(Ic)に選択的に処理を施す映像処理方法であって、
    前記映像ストリーム(Svc)をフレーム単位で輝度情報(VY)を示す輝度フレーム(Y)と、色差情報(VCb、VCr)を示す複数の色差フレーム(Cb、Cr)とに分離する映像ストリーム分離ステップ(003)と、
    前記輝度情報(VY)および前記輝度情報(VCb、VCr)の少なくとも何れかに基づいて、前記組み込まれた文字情報(Ic)を認識する文字認識ステップ(011;#100〜#800)と、
    前記認識された文字情報(Ic)に対して、消去、移動、および拡倍の少なくとも何れかの処理を施す文字加工ステップ(012;#1100〜#1600)とを備える映像処理方法(Avp)。
  2. 前記文字認識ステップ(011;#100〜#800)は、
    前記輝度フレーム(Y)における画素(P)の輝度値(VY)を閾値(Vth)と比較する輝度値判定ステップ(S208)と、
    前記閾値(Vth)より大きな輝度値(VY)を有する画素(P)を前記文字情報(Ic)を表す文字画素(Pc)として認識する文字画素認識ステップ(S208、S210)と、
    前記認識された文字画素(Pc)を文字表示画素テーブル(013;Cp)に登録する文字画素登録ステップ(S216)と、
    前記認識された文字画素(Pc)が一つ以上存在するフレームを前記文字情報(Ic)が含まれるフレームとして文字表示フレームテーブル(014;Fc)に登録する文字情報フレーム登録ステップ(S212、S216)とを備える、請求項1に記載の映像処理方法(#200)。
  3. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の色差値(Vcb、Vcr)が所定範囲内(Vcb1<Vcb<Vcb2、Vcr1<Vcr<Vcr2)であるかを判定する色差値判定ステップ(S312)と、
    前記色差値(Vcb、Vcr)が所定範囲内(Vcb1<Vcb<Vcb2、Vcr1<Vcr<Vcr2)であると判定される場合には、前記文字情報(Ic)は同一色であると認識する文字同一色認識ステップ(S312、Yes)とを備える、請求項2に記載の映像処理方法(#300)。
  4. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記輝度判定ステップ(S208)により、その輝度値(VY)が閾値(Vth)と比較される画素(P)を選択する画素選択ステップ(#100、S206)を備える、請求項2に記載の映像処理方法(#100)。
  5. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の相互の離間距離(L)を算出する文字画素間距離算出ステップ(S408、S410)と、
    前記算出された離間距離(L)を平均して平均離間距離(L(mean))を算出する平均離間距離算出ステップ(S412)と、
    隣接する文字画素(Pc)との前記離間距離(L)が前記平均離間距離(L(mean))より所定距離(γ)だけ大きな文字画素(Pc)を前記文字表示画素テーブル(013)から削除する非文字画素認定ステップ(S416、S418)とを備える、請求項2に記載の映像処理方法(#400)。
  6. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の水平方向への連続性(Ch)を検出する水平方向文字画素連続性検出ステップ(S508)と、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の垂直方向への連続性(Cv)を検出する垂直方向文字画素連続性検出ステップ(S510)と、
    前記水平方向への連続性(Ch)および垂直方向への連続性(Cv)に基づいて、文字線幅を認識する文字線幅認識ステップ(S518、S522、S528)とを備える、請求項2に記載の映像処理方法(#500)。
  7. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の周辺画素(Pp)の色差値が均一(Y≒Y(mean)、Cb≒Cb(mean)、Cr≒Cr(mean))であるかを判定する周辺画素色差値判定ステップ(S610)と、
    周辺画素(Pp)の色差値が均一(Y≒Y(mean)、Cb≒Cb(mean)、Cr≒Cr(mean))であると判定される場合には、前記文字情報(Ic)は一定色で縁取りされていることを認識する縁取り認識ステップ(S628)とを備える、請求項2に記載の映像処理方法(#600)。
  8. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示フレームテーブル(014;Fc)に登録されている前記文字情報(Ic;Pc)の出現期間(P1)を検出する文字情報出現期間検出ステップ(S704)と、
    前記文字表示フレームテーブル(014;Fc)に登録されている前記文字情報(Ic;Pc)の非出現期間(P2)を検出する文字情報非出現期間検出ステップ(S708)と、
    前記検出された出現期間(P1)および非出現期間(P2)に基づいて、前記文字情報(Ic)が一定の時間間隔で表示および消去を繰り返す点滅表示であることを認識する文字情報点滅表示認識ステップ(S710)とを備える、請求項2に記載の映像処理方法(#700)。
  9. 前記文字認識ステップ(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)および前記前記文字表示フレームテーブル(014;Fc)に基づいて、時間軸上の任意の第1のフレームにおける文字画素(Pc)の第1の分布(Dn)を検出する第1画素分布検出ステップ(S806)と、
    前記文字表示画素テーブル(013;Cp)および前記前記文字表示フレームテーブル(014;Fc)に基づいて、前記第1のフレームとは異なる時間軸上の任意の第2のフレームにおける文字画素(Pc)の第2の分布(Dβ)を検出する第2画素分布検出ステップ(S808)と、
    前記第1の分布(Dn)に基づいて、前記第1のフレームと第2のフレームの間の任意の時間軸上の文字画素(Pc)の第3の分布(Dd)を検出する第3画素分布検出ステップ(S810、S812)と、
    前記第2の分布(Dβ)と前記第3の分布(Dd)との差分を検出する分布差分検出ステップ(S814)と、
    前記差分に基づいて、前記文字情報(Ic)が一定の速度で移動する移動表示であることを認識する移動表示認識ステップ(S814、S816)とを備える、請求項2に記載の映像処理方法(#800)。
  10. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間ステップ(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項2に記載の映像処理方法(#1300)。
  11. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間ステップ(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、前記文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項2に記載の映像処理方法(#1100)。
  12. 前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Cp)の輝度値(VYt)および色差値(VCbt、VCrt)を、前記文字表示画素テーブルに登録されていない時間的に近接するフレームにおいて対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間ステップ(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、前記文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項9に記載の映像処理方法(#1200)。
  13. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間ステップ(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記文字表示画素テーブル(014;Fp)に登録されている文字画素(Pc)を所定距離だけ移動させた時の位置を求める文字画素移動後位置決定ステップ(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定ステップ(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更ステップ(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項2に記載の映像処理方法(#1400)。
  14. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間ステップ(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記文字表示画素テーブル(014;Fp)に登録されている文字画素(Pc)を所定距離だけ移動させた時の位置を求める文字画素移動後位置決定ステップ(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定ステップ(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更ステップ(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項2に記載の映像処理方法(#1400)。
  15. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間ステップ(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記文字画素(P)の各座標値(x、y)を所定の拡倍量(M)で拡倍する拡倍ステップ(S1510)と、
    前記拡倍された位置に対応する画素(P)を決定する移動後画素決定ステップ(S1512)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする拡倍先画素値変更ステップ(S1516)とを備え、前記文字情報(Ic)は前記拡倍量(M)だけ拡倍されることを特徴とする請求項2に記載の映像処理方法(#1500)。
  16. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間ステップ(S1516)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記文字画素(P)の各座標値(x,y)を所定の拡倍量(M)で拡倍する拡倍ステップ(S1510)と、
    前記拡倍された位置に対応する画素(P)を決定する移動後画素決定ステップ(S1512)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする拡倍先画素値変更ステップ(S1516)とを備え、前記文字情報(Ic)は前記拡倍量(M)だけ拡倍されることを特徴とする請求項2に記載の映像処理方法(#1500)。
  17. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間ステップ(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記映像ストリーム(Svc)における非注目領域を認識する非注目領域認識ステップ(S1604)と、
    前記非注目領域と前記文字情報(Ic)との離間距離(S)を算出する離間距離検出ステップ(S1608)と、
    前記文字画素(Pc)を前記離間距離(S)だけ移動させた時の位置を求める文字画素移動後位置決定ステップ(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定ステップ(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更ステップ(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項2に記載の映像処理方法(#1400)。
  18. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間ステップ(#1400R)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正ステップ(S1308、S1312)と、
    前記映像ストリーム(Svc)における非注目領域を認識する非注目領域認識ステップ(S1604)と、
    前記非注目領域と前記文字情報(Ic)との離間距離(S)を算出する離間距離検出ステップ(S1608)と、
    前記文字画素(Pc)を前記離間距離(S)だけ移動させた時の位置を求める文字画素移動後位置決定ステップ(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定ステップ(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更ステップ(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項2に記載の映像処理方法(#1400)。
  19. 入力される映像ストリーム(Svc)に組み込まれた文字情報(Ic)に選択的に処理を施す映像処理装置(Avp)であって、
    前記映像ストリーム(Svc)をフレーム単位で輝度情報(VY)を示す輝度フレーム(Y)と、色差情報(VCb、VCr)を示す複数の色差フレーム(Cb、Cr)とに分離する映像ストリーム分離手段(003)と、
    前記輝度情報(VY)および前記輝度情報(VCb、VCr)の少なくとも何れかに基づいて、前記組み込まれた文字情報(Ic)を認識する文字認識手段(011;#100〜#800)と、
    前記認識された文字情報(Ic)に対して、消去、移動、および拡倍の少なくとも何れかの処理を施す文字加工手段(012;#1100〜#1600)とを備える映像処理装置(Avp)。
  20. 前記文字認識手段(011;#100〜#800)は、
    前記輝度フレーム(Y)における画素(P)の輝度値(VY)を閾値(Vth)と比較する輝度値判定手段(S208)と、
    前記閾値(Vth)より大きな輝度値(VY)を有する画素(P)を前記文字情報(Ic)を表す文字画素(Pc)として認識する文字画素認識手段(S208、S210)と、
    前記認識された文字画素(Pc)を文字表示画素テーブル(013;Cp)に登録する文字画素登録手段(S216)と、
    前記認識された文字画素(Pc)が一つ以上存在するフレームを前記文字情報(Ic)が含まれるフレームとして文字表示フレームテーブル(014;Fc)に登録する文字情報フレーム登録手段(S212、S216)とを備える、請求項19に記載の映像処理装置(Avp)。
  21. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の色差値(Vcb、Vcr)が所定範囲内(Vcb1<Vcb<Vcb2、Vcr1<Vcr<Vcr2)であるかを判定する色差値判定手段(S312)と、
    前記色差値(Vcb、Vcr)が所定範囲内(Vcb1<Vcb<Vcb2、Vcr1<Vcr<Vcr2)であると判定される場合には、前記文字情報(Ic)は同一色であると認識する文字同一色認識手段(S312、Yes)とを備える、請求項20に記載の映像処理装置(Avp;#300)。
  22. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記輝度判定手段(S208)により、その輝度値(VY)が閾値(Vth)と比較される画素(P)を選択する画素選択手段(#100、S206)を備える、請求項20に記載の映像処理装置(Avp:#100)。
  23. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の相互の離間距離(L)を算出する文字画素間距離算出手段(S408、S410)と、
    前記算出された離間距離(L)を平均して平均離間距離(L(mean))を算出する平均離間距離算出手段(S412)と、
    隣接する文字画素(Pc)との前記離間距離(L)が前記平均離間距離(L(mean))より所定距離(γ)だけ大きな文字画素(Pc)を前記文字表示画素テーブル(013)から削除する非文字画素認定手段(S416、S418)とを備える、請求項20に記載の映像処理装置(Avp:#400)。
  24. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の水平方向への連続性(Ch)を検出する水平方向文字画素連続性検出手段(S508)と、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の垂直方向への連続性(Cv)を検出する垂直方向文字画素連続性検出手段(S510)と、
    前記水平方向への連続性(Ch)および垂直方向への連続性(Cv)に基づいて、文字線幅を認識する文字線幅認識手段(S518、S522、S528)とを備える、請求項20に記載の映像処理装置(Avp;#500)。
  25. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の周辺画素(Pp)の色差値が均一(Y≒Y(mean)、Cb≒Cb(mean)、Cr≒Cr(mean))であるかを判定する周辺画素色差値判定手段(S610)と、
    周辺画素(Pp)の色差値が均一(Y≒Y(mean)、Cb≒Cb(mean)、Cr≒Cr(mean))であると判定される場合には、前記文字情報(Ic)は一定色で縁取りされていることを認識する縁取り認識手段(S628)とを備える、請求項20に記載の映像処理装置(Avp;#600)。
  26. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示フレームテーブル(014;Fc)に登録されている前記文字情報(Ic;Pc)の出現期間(P1)を検出する文字情報出現期間検出手段(S704)と、
    前記文字表示フレームテーブル(014;Fc)に登録されている前記文字情報(Ic;Pc)の非出現期間(P2)を検出する文字情報非出現期間検出手段(S708)と、
    前記検出された出現期間(P1)および非出現期間(P2)に基づいて、前記文字情報(Ic)が一定の時間間隔で表示および消去を繰り返す点滅表示であることを認識する文字情報点滅表示認識手段(S710)とを備える、請求項20に記載の映像処理装置(Avp;#700)。
  27. 前記文字認識手段(011;#100〜#800)は、さらに、
    前記文字表示画素テーブル(013;Cp)および前記前記文字表示フレームテーブル(014;Fc)に基づいて、時間軸上の任意の第1のフレームにおける文字画素(Pc)の第1の分布(Dn)を検出する第1画素分布検出手段(S806)と、
    前記文字表示画素テーブル(013;Cp)および前記前記文字表示フレームテーブル(014;Fc)に基づいて、前記第1のフレームとは異なる時間軸上の任意の第2のフレームにおける文字画素(Pc)の第2の分布(Dβ)を検出する第2画素分布検出手段(S808)と、
    前記第1の分布(Dn)に基づいて、前記第1のフレームと第2のフレームの間の任意の時間軸上の文字画素(Pc)の第3の分布(Dd)を検出する第3画素分布検出手段(S810、S812)と、
    前記第2の分布(Dβ)と前記第3の分布(Dd)との差分を検出する分布差分検出手段(S814)と、
    前記差分に基づいて、前記文字情報(Ic)が一定の速度で移動する移動表示であることを認識する移動表示認識手段(S814、S816)とを備える、請求項20に記載の映像処理装置(Avp;#800)。
  28. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間手段(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCr、VCb)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項20に記載の映像処理装置(Avp;#1300)。
  29. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間手段(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、前記文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項20に記載の映像処理装置(Avp;#1100)。
  30. 前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Cp)の輝度値(VYt)および色差値(VCbt、VCrt)を、前記文字表示画素テーブルに登録されていない時間的に近接するフレームにおいて対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間手段(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、前記文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)とを備え、前記上書きされた輝度信号(Y)および色差信号(Cb、Cr)からは前記文字情報(Ic)は消去されていることを特徴とする、請求項27に記載の映像処理装置(Avp;#1200)。
  31. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間手段(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記文字表示画素テーブル(014;Fp)に登録されている文字画素(Pc)を所定距離だけ移動させた時の位置を求める文字画素移動後位置決定手段(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定手段(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更手段(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項20記載の映像処理装置(Avp:#1400)。
  32. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VYt)および色差値(VCb、VCr)で補間する画素値補間手段(S1308)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記文字表示画素テーブル(014;Fp)に登録されている文字画素(Pc)を所定距離だけ移動させた時の位置を求める文字画素移動後位置決定手段(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定手段(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更手段(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項20に記載の映像処理装置(Avp;#1400)。
  33. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間手段(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記文字画素(P)の各座標値(x,y)を所定の拡倍量(M)で拡倍する拡倍手段(S1510)と、
    前記拡倍された位置に対応する画素(P)を決定する移動後画素決定手段(S1512)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする拡倍先画素値変更手段(S1516)とを備え、前記文字情報(Ic)は前記拡倍量(M)だけ拡倍されることを特徴とする請求項20に記載の映像処理装置(Avp;#1500)。
  34. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間手段(S1516)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記文字画素の各座標値(x,y)を所定の拡倍量(M)で拡倍する拡倍手段(S1510)と、
    前記拡倍された位置に対応する画素(P)を決定する移動後画素決定手段(S1512)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする拡倍先画素値変更手段(S1516)とを備え、前記文字情報(Ic)は前記拡倍量(M)だけ拡倍されることを特徴とする請求項20に記載の映像処理装置(Avp;#1500)。
  35. さらに、前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)を、当該文字画素(Pc)に隣接する画素(P)の輝度値(VY)および色差値(VCr、VCb)に基づいてそれぞれ線形補間する画素値補間手段(S1306)と、
    前記線形補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記映像ストリーム(Svc)における非注目領域を認識する非注目領域認識手段(S1604)と、
    前記非注目領域と前記文字情報(Ic)との離間距離(S)を算出する離間距離検出手段(S1608)と、
    前記文字画素(Pc)を前記離間距離(S)だけ移動させた時の位置を求める文字画素移動後位置決定手段(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定手段(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素(Pc)の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更手段(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項20に記載の映像処理装置(Avp;#1400)。
  36. さらに、前記文字表示フレームテーブル(014;Fp)に登録されているフレームにおける前記文字表示画素テーブル(013;Cp)に登録されている文字画素(Pc)の輝度値(VYt)および色差値(VCbt、VCrt)のそれぞれを当該文字表示フレームテーブル(014;Fp)に登録されていない時間的に近接したフレームにおける対応する画素(P)の輝度値(VY)および色差値(VCb、VCr)で補間する画素値補間手段(#1400R)と、
    前記補間された輝度値(VYt)および色差値(VCbt、VCrt)で、当該文字画素の輝度信号(Y)および色差信号(Cb、Cr)を上書きするフレーム信号補正手段(S1308、S1312)と、
    前記映像ストリーム(Svc)における非注目領域を認識する非注目領域認識手段(S1604)と、
    前記非注目領域と前記文字情報(Ic)との離間距離(S)を算出する離間距離検出手段(S1608)と、
    前記文字画素(Pc)を前記離間距離(S)だけ移動させた時の位置を求める文字画素移動後位置決定手段(S1410)と、
    前記決定された移動後の位置に対応する画素(P)を決定する移動後画素決定手段(S1410)と、
    前記決定された画素(P)の輝度値(VY)および色差値(VCb、VCr)のそれぞれを前記文字画素の輝度値(VY(c))および色差値(VCb(c)、VCr(c))で上書きする移動先画素値変更手段(S1412)とを備え、前記文字情報(Ic)は所定距離だけ移動されることを特徴とする請求項20に記載の映像処理装置(Avp;#1400)。
  37. 請求項20に記載の映像処理装置(Avp)によって処理が施された映像ストリーム(Svt)を再生する再生手段(020)を備える映像再生装置(Ap)。
  38. 前記再生された映像ストリーム(Svts)に基づいて映音像を提示する提示手段(021)をさらに備える、請求項37に記載の映像再生表示装置(Ap)。
  39. 請求項20に記載の映像処理装置(Avp)によって処理を施された映像ストリーム(Svt)を記録する記録手段(016、017、019)を備える映像記録装置(Ar)。
JP2006529179A 2004-07-20 2005-07-15 映像処理装置およびその方法 Expired - Fee Related JP4667381B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004211952 2004-07-20
JP2004211952 2004-07-20
PCT/JP2005/013143 WO2006009105A1 (ja) 2004-07-20 2005-07-15 映像処理装置およびその方法

Publications (2)

Publication Number Publication Date
JPWO2006009105A1 true JPWO2006009105A1 (ja) 2008-05-01
JP4667381B2 JP4667381B2 (ja) 2011-04-13

Family

ID=35785216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006529179A Expired - Fee Related JP4667381B2 (ja) 2004-07-20 2005-07-15 映像処理装置およびその方法

Country Status (4)

Country Link
US (1) US7817856B2 (ja)
JP (1) JP4667381B2 (ja)
CN (1) CN100542239C (ja)
WO (1) WO2006009105A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080199098A1 (en) * 2007-02-19 2008-08-21 Seiko Epson Corporation Information processing method, information processing apparatus, and storage medium having program stored thereon
US8929461B2 (en) * 2007-04-17 2015-01-06 Intel Corporation Method and apparatus for caption detection
JP5591708B2 (ja) 2007-10-23 2014-09-17 トムソン ライセンシング マルチキャストの信頼性を向上させる方法、システム及び装置
JP2009278373A (ja) * 2008-05-14 2009-11-26 Sharp Corp 画像処理装置、画像形成装置及びコンピュータプログラム
JP5267568B2 (ja) * 2008-11-12 2013-08-21 富士通株式会社 テロップ移動処理装置、方法及びプログラム
US8744119B2 (en) 2011-01-12 2014-06-03 Gary S. Shuster Graphic data alteration to enhance online privacy
US11080513B2 (en) 2011-01-12 2021-08-03 Gary S. Shuster Video and still image data alteration to enhance privacy
US20120207386A1 (en) * 2011-02-11 2012-08-16 Microsoft Corporation Updating A Low Frame Rate Image Using A High Frame Rate Image Stream
JP2014519224A (ja) * 2011-04-28 2014-08-07 サムスン エレクトロニクス カンパニー リミテッド 無線通信システムにおけるデータ伝送率調節方法及び装置
JP5349649B1 (ja) * 2012-05-25 2013-11-20 株式会社東芝 電子機器、電子機器の制御方法、電子機器の制御プログラム
US9628865B2 (en) * 2012-09-10 2017-04-18 Apple Inc. Enhanced closed caption feature
US8750675B2 (en) * 2012-09-21 2014-06-10 International Business Machines Corporation Accessing and storing original broadcast content
TWI520609B (zh) * 2012-10-05 2016-02-01 緯創資通股份有限公司 顯示系統以及通訊方法
US9569679B1 (en) * 2012-12-04 2017-02-14 A9.Com, Inc. Adaptive image sampling for text detection
CN104023167B (zh) * 2014-04-03 2017-06-23 江苏省广播电视集团有限公司 应急备播系统及其备播方法
JP5913763B1 (ja) * 2015-07-17 2016-04-27 楽天株式会社 基準線設定装置、基準線設定方法及び基準線設定プログラム
US10424055B2 (en) * 2016-05-27 2019-09-24 Canon Kabushiki Kaisha Image processing apparatus and method for controlling the same
JP2022021875A (ja) 2020-07-22 2022-02-03 株式会社リコー 情報処理装置およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62178666U (ja) * 1986-05-06 1987-11-13
JP2000350095A (ja) * 1999-06-08 2000-12-15 Yamaha Corp 映像処理装置
JP2001136450A (ja) * 1999-11-02 2001-05-18 Funai Electric Co Ltd 映像表示装置
JP2003333445A (ja) * 2002-05-16 2003-11-21 Seiko Epson Corp 字幕抽出装置
JP2004023492A (ja) * 2002-06-17 2004-01-22 Sharp Corp 表示装置、映像表示方法、映像表示プログラム、および記録媒体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5262860A (en) * 1992-04-23 1993-11-16 International Business Machines Corporation Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal
GB9312690D0 (en) * 1993-06-18 1993-08-04 Philips Electronics Uk Ltd Television receiver
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
JPH09200684A (ja) 1996-01-12 1997-07-31 Sony Corp 映像/音声信号記録装置
MY119560A (en) * 1996-05-27 2005-06-30 Nippon Telegraph & Telephone Scheme for detecting captions in coded video data without decoding coded video data
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
US6937766B1 (en) * 1999-04-15 2005-08-30 MATE—Media Access Technologies Ltd. Method of indexing and searching images of text in video
US6587153B1 (en) * 1999-10-08 2003-07-01 Matsushita Electric Industrial Co., Ltd. Display apparatus
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
KR100477656B1 (ko) * 2002-07-27 2005-03-22 삼성전자주식회사 디지털 화질 개선 방법 및 장치
EP1561343A4 (en) * 2002-11-15 2007-03-21 Thomson Licensing METHODS FOR CONTROLLING DEVICES HAVING EMERGENCY ALERT FUNCTION
WO2005048591A1 (en) * 2003-11-17 2005-05-26 Koninklijke Philips Electronics N.V. Method of video image processing
KR100537520B1 (ko) * 2004-02-18 2005-12-19 삼성전자주식회사 동영상의 자막 검출 방법 및 장치
KR20060084599A (ko) * 2005-01-20 2006-07-25 엘지전자 주식회사 영상표시기기의 문자 표시장치 및 방법
KR20080031555A (ko) * 2006-10-04 2008-04-10 삼성전자주식회사 데이터 송수신 장치 및 방법
JP4861845B2 (ja) * 2007-02-05 2012-01-25 富士通株式会社 テロップ文字抽出プログラム、記録媒体、方法及び装置
JP4536790B2 (ja) * 2008-04-30 2010-09-01 シャープ株式会社 情報出力装置、情報出力方法、制御プログラム、コンピュータ読み取り可能な記録媒体、および電子会議システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62178666U (ja) * 1986-05-06 1987-11-13
JP2000350095A (ja) * 1999-06-08 2000-12-15 Yamaha Corp 映像処理装置
JP2001136450A (ja) * 1999-11-02 2001-05-18 Funai Electric Co Ltd 映像表示装置
JP2003333445A (ja) * 2002-05-16 2003-11-21 Seiko Epson Corp 字幕抽出装置
JP2004023492A (ja) * 2002-06-17 2004-01-22 Sharp Corp 表示装置、映像表示方法、映像表示プログラム、および記録媒体

Also Published As

Publication number Publication date
WO2006009105A1 (ja) 2006-01-26
US20080085051A1 (en) 2008-04-10
JP4667381B2 (ja) 2011-04-13
CN1989765A (zh) 2007-06-27
US7817856B2 (en) 2010-10-19
CN100542239C (zh) 2009-09-16

Similar Documents

Publication Publication Date Title
JP4667381B2 (ja) 映像処理装置およびその方法
JP3773670B2 (ja) 情報呈示方法および情報呈示装置および記録媒体
KR100636910B1 (ko) 동영상검색시스템
US8761582B2 (en) Video editing device and video editing system
JP4831623B2 (ja) 動画像の顔インデックス作成装置およびその顔画像追跡方法
EP1775664A2 (en) Image processing apparatus
US20130236162A1 (en) Video editing apparatus and method for guiding video feature information
US20040240005A1 (en) Editing apparatus and method using thumbnail image
JP2007053496A (ja) 映像表示方法、映像表示方法のプログラム、映像表示方法のプログラムを記録した記録媒体及び映像表示装置
KR101319544B1 (ko) 인물의 등장 장면을 검출하는 촬영장치 및 이를 이용한검출 방법
CN110502117B (zh) 电子终端中的截图方法以及电子终端
US8644670B2 (en) Apparatus and method for reproducing contents
JP4215681B2 (ja) 動画像処理装置及びその方法
JP3372096B2 (ja) 画像情報アクセス装置
US20090087088A1 (en) Image forming system, apparatus and method of discriminative color features extraction thereof
JPWO2007114241A1 (ja) 映像処理装置
JP2007515864A (ja) ビデオ画像処理方法
JP4540358B2 (ja) ポインタ位置特定プログラムおよびポインタ位置特定方法
JP4456874B2 (ja) 画像ディスプレイ装置
JP3625935B2 (ja) 動画像の重要画像抽出装置および重要画像抽出方法
JP2000125243A (ja) 映像記録再生装置及び記録媒体
US6243086B1 (en) Reproduction apparatus
JP2008289088A (ja) データ表示制御装置、データ表示制御方法及びプログラム
JP3024574B2 (ja) 動画像検索装置
JP4906615B2 (ja) ピッチショット検出システム、参照ピッチショット画像選定装置及び参照ピッチショット画像選定プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080604

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4667381

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees