JP2003530028A - テキスト検出 - Google Patents

テキスト検出

Info

Publication number
JP2003530028A
JP2003530028A JP2001573777A JP2001573777A JP2003530028A JP 2003530028 A JP2003530028 A JP 2003530028A JP 2001573777 A JP2001573777 A JP 2001573777A JP 2001573777 A JP2001573777 A JP 2001573777A JP 2003530028 A JP2003530028 A JP 2003530028A
Authority
JP
Japan
Prior art keywords
text
line
field
detector
edge detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001573777A
Other languages
English (en)
Inventor
マリナ エム ピー ニコラス
ミシェル ダブリュー ニューウェンヒューゼン
ジェローエン エム ケッテニス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003530028A publication Critical patent/JP2003530028A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/44504Circuit details of the additional information generator, e.g. details of the character or graphics signal generator, overlay mixing circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • H04N7/012Conversion between an interlaced and a progressive signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Signal Processing (AREA)
  • Television Systems (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Picture Signal Circuits (AREA)

Abstract

(57)【要約】 ビデオ信号(VS)のテキストを検出する方法において、ビデオ信号(VS)の高域水平周波数が、水平エッジ検出結果(refo, refpp1, refpp2)を得るために検出(ED)され、更に所与の位置における水平エッジ検出結果(refo)が、垂直に隣接する位置における水平エッジ検出結果(refpp1, refpp2)と相関(c)される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、ビデオ信号のテキスト検出の方法及び装置に関する。
【0002】
【従来の技術】
欧州特許公開公報EP-A-0,687,105は、ビデオ信号の動きを検出する方法を開示
する。この方法は、フィールドのライン間に新しいラインを生成するために使用
されることができる。最初に、画像間の差信号が算出される。考察される位置の
最小動き領域を与えるこの差信号は、2つの連続フィールドから算出されるエッ
ジ情報を使用して、水平方向に伸びる。エッジ検出器は、最小動き領域を規定す
る奇数又は偶数番目の連続フィールド間のスレッショルドによる差信号と、水平
エッジによる最小動き領域の制御された水平伸張とに基づく。こうして、水平エ
ッジは、高域垂直周波数を有する。
【0003】 米国特許第5,051,826号は、テレビジョン画像の動き適応順次走査変換回路の
垂直エッジ検出回路を開示する。この回路は、インタレースされた走査入力テレ
ビジョン信号からフィールド内差信号を生成する(ラインメモリベースの)第1
回路と、インタレースされた走査入力テレビジョン信号からフィールド間差信号
を生成する(フィールドメモリベースの)第2回路とを含む。第3回路は、選択
的に、フレーム間差信号が、予め決定された値より小さい場合には、フィールド
内差信号及びフィールド間差信号の最大値を出力し、予め決定された値より大き
い場合には、フィールド内差信号の最大値を出力する。この米国特許明細書にお
いて、「垂直エッジ」と呼ばれるものは、欧州特許公開公報EP-A-0,687,105の「
水平エッジ」と呼ばれるものと同じである。
【0004】 米国特許第5,565,998号(代理人の整理番号PHB 33.833)は、ビデオシーケン
スのフィルムフレームを識別する方法を開示する。
【0005】 既知の動き補償された補間技術は、テキストのスクロールをうまく処理できな
い問題を欠点としてもっていることが明らかである。とりわけ困難な問題は、ビ
デオモードテキストが、フィルムモード信号に加えられるときに起こる、フィル
ムモードの背景全面をスクロールするビデオモードテキストである。ここでは、
フィルムモードとは、1対のインタレースされたフィールドが、同じ動き位相に
関連するということを意味し、当該位相は、2つのインタレースされたビデオフ
ィールドを生成する1つのフィルムフレームを使用することにより、50ヘルツ
のビデオ信号が、25ヘルツのフィルム信号から引き出されるときに起こる。ビ
デオモードにおいて、それぞれのフィールドは、別個の動き位相を示す。これら
の問題は、上述された引用公知文献では取り扱われていない。
【0006】
【発明が解決しようとする課題】
本発明の目的は、とりわけ、向上されたテキスト検出を提供することである。
この目的のために、本発明は、独立請求項で規定される如きテキスト検出を提供
する。好適な実施例は、従属請求項で規定される。
【0007】
【課題を解決するための手段】
本発明の第1態様によるビデオ信号のテキストを検出する方法において、水平
エッジ検出結果を得るために、ビデオ信号の高域水平周波数が検出され、所与の
位置の水平エッジ検出結果は、垂直に隣接する位置の水平エッジ検出結果と相関
される。
【0008】 本発明のこれら及び他の態様は、下文で説明される実施例を参照すると、より
明らかになり、明瞭に説明されるであろう。
【0009】 本発明による静止/動きテキスト検出器の目的は、ビデオ画像において、動き
補償された補間のような特別なビデオ処理に対して極めて感度が高いテキストを
識別することである。テキストとは、合間にスペースを取る可能性がある、関連
する複数の連続文字を意味する。本発明は、ラテンアルファベット文字に限定さ
れず、このシステムは、他の文字、とりわけアラビア文字にもかなり適切に動作
する。
【0010】
【発明の実施の形態】
図1の表示装置は、 ビデオ信号VSの任意のテキスト遷移の水平な位置及び方向(LOWからHIGHへ
の遷移、又はHIGHからLOWへの遷移)を示す遷移(エッジ)検出器EDと、 テキスト遷移の位置及び方向を、3つの空間的に連続したライン(フィールド
nのラインm、フィールドnのラインm-2(すなわち、インタレースされたビデオ信
号において、同じフィールド内で先行するライン)、及びこれらのラインm-2とm
との間に空間的に位置するが但しフィールドn-1に位置するラインm-1)にわたっ
て比較する相関器Cと、 検出された遷移が、本当にテキストに対応しているのかを確認し、本当に対応
する場合は、当該検出されたテキスト遷移が、静止テキストに対応しているのか
、又は水平動きテキストに対応しているのかを示すポスト処理ユニットPPUであ
って、更にテキストの速度などの追加情報を伝え、更にテキストの高さ及び長さ
、並びにスクリーンにおけるその位置などを伝えるようにも容易に適用されるこ
とができ、更に相関器Cを正しい位置で調べさせるために使用されるテキストの
速度を示す速度推定値SEを相関器Cに送る、ポスト処理ユニットPPUと、 画像の特定箇所への検出を制限することができるウィンドウ指示ユニットWと
、 検出されたテキスト及び関連情報(静止/動きテキスト,速度など)に依存し
て、ビデオ信号VSを処理する動き補償されたプロセッサMCP(例えば、100ヘルツ
コンバータ)と、 動き補償されたビデオ信号を表示する表示装置Dとを有する。
【0011】 遷移検出器ED及び相関器Cは、画素ベースで動作する一方で、ポスト処理ユニ
ットPPUは、ラインベースで動作する。遷移検出器EDは、数個の画素(通常3個
の画素)内の低い閾値と高い閾値との双方を輝度レベルが超える位置を調べる。
検出器EDの出力refo(画素)は、 画素が、HIGHからLOWへの遷移に対応する場合、0であり、 画素が、LOWからHIGHへの遷移に対応する場合、2であり、 上記以外の場合、1である。 基本的に、検出器EDは、概してテキスト文字の最初及び最後の画素をマークする
【0012】 テキスト検出の原理は、小さな垂直ラインがテキストの特性であるという事実
を使用する。テキストの場合、 数本の連続ライン(フィールドnのラインm,フィールドnのラインm-2、及びこ
れらのラインm-2とmとの間に空間的に位置するが但しフィールドn-1に位置する
ラインm-1)にわたる検出器refo(画素)の出力間に高い相関関係があり、 マークされた画素(0又は2におけるrefo(画素))の密度は、テキストの長さ
全体にわたって比較的高い。
【0013】 インタレースされたビデオモードにおける静止/動きの検出の原理は、 静止においては、フィールドnのラインmからフィールドnのラインm-2までの遷
移整合の周波数が、フィールドnのラインmとラインm-2との間に垂直方向的に位
置する、フィールドnのラインmからフィールドn-1のラインm-1までの遷移整合の
周波数よりも低く、その一方で、 動きテキストにおいては、フィールドnのラインmからフィールドnのラインm-2
までの遷移整合の周波数が、フィールドnのラインmとラインm-2との間に垂直方
向的に位置する、フィールドnのラインmからフィールドn-1のラインm-1までの遷
移整合の周波数よりもずっと高いという原理である。
【0014】 この原理は、先行フレームからのデータで先行フィールドからのデータを置き
換えることによって、順次ビデオモードに容易に適応されうる。
【0015】 相関器C及びポスト処理ユニットPPUは、ラインが、静止テキストを含むのか、
動きテキストを含むのか、又は全くテキストを含まないのかを識別するために、
これらのアイディアを使用する。或る実施例では、3つのカウンタが使用される
。カウント1(Count1)は、フィールドnのラインm-2からフィールドnのラインmま
での整合の頻度(周波数)を表わす。カウント2(Count2)は、フィールドnのラ
インmからフィールドn-1のラインm-1までの整合の頻度(周波数)を表わす。カ
ウント3(Count3)は、ラインのテキストの長さに対応し、テキスト検出に適した
閾値を設定するために使用される。 Count1>Count3/16 且つ Count2>Count1の場合、静止テキストが検出される。
Count1>Count3/16 且つ Count1/2*Count2の場合、動きテキストが検出される。
【0016】 このシステムは、静止及び動きテキストを正確に検出するのに適していると実
証された。とりわけ、このシステムが、動き(又は静止)テキストを静止(又は
動き)テキストとして識別してしまうような実地事例が見出されたことは全くな
かった。文字シーケンスの高さの範囲では、文字シーケンスの最上部又は最下部
に対応するラインを時には除いて、実際に全てのラインが、テキストラインとし
て識別されている。
【0017】 マルチバースト信号の場合、いくつかの「間違った検出」の場合がある。これ
は、テキストをもつラインのグループ間でテキストをもたない幾つかのラインの
存在を確認することで解決されることができる。
【0018】 このアルゴリズムは、テキストの水平速度を伝えるために拡張されうる。どの
方向に向かってテキストが動いているのかがわかっているという場合、当該シス
テムは、m画素/フィールドに等しい速度におけるテキストを識別するために、m
ラインを必要とする。方向が分からない場合、速度を識別するのに2*mラインを
必要としうる。殆どの場合、テキストがスクリーンのどちらの側から来るのかを
検出することができるので、テキストの方向を知ることができる。テキストの速
度が、通常、1フィールド当たり10画素以下であると認識する場合、1つの文
字高さの範囲において確実な速度出力が可能である。
【0019】 この速度検索メカニズムは、テキストが検出されるとき、第1フィールドのた
めに使用される。この速度の結果が、後に続くフィールドの静止/動きテキスト
検出のために直接使用されることができる。
【0020】 このシステムは、検出されたテキストのサイズ及び位置に関する情報も容易に
供給することが更にできる。
【0021】 図2において、動きテキスト検出器の更に詳細なブロック図が、与えられる。
このシステムの中心部も、エッジ検出器ED、相関器C、及びポスト処理ユニットP
PUによって構成されている。エッジ検出器EDの出力は、位置情報及び遷移方向で
ある。この情報は、相関器Cにより使用されるとともに、ラインメモリLM及びフ
ィールドメモリFMに記憶される。相関器Cは、現在のラインと、現在のフィール
ドから先行するラインと、先行するフィールドから中間にあるラインとである3
本のラインに関するエッジ情報を必要とする。殆どの水平動きテキストは、スク
リーンの最上部及び最下部にあると予測されるので、フレキシブルなウィンドウ
指示ユニットWが、必要な処理量を制限するために加えられる。
【0022】 図1の実施例に加えて、図2の実施例は、画素ベースのピーク検出器Pを有し
、このピーク検出器Pの出力が、エッジレベル選択信号ELにより、エッジ検出器E
Dの閾値レベルを適応させるフィールドベースの制御プロセッサCPにより使用さ
れる。制御プロセッサCPは、ウィンドウを適応させるウィンドウ指示ユニットW
にウィンドウ選択信号WSを送る。例えば、動きテキストが検出されると、当該ウ
ィンドウは、このテキストの動きに適応されうる(例えば、2*2の水平な別個の
ウィンドウの代わりに、図3の例におけるhwindow_start_leftからhwindow_stop
_rightまで延在する2*1の大きなウィンドウを得る)。制御プロセッサCPは、更
に当該信号がフィルムモードであるか、ビデオモードであるか、又はテキストで
あるか否かを発信する。
【0023】 従って、ウィンドウが、フレキシブルな態様(図3参照)で規定される。この
フレキシブルなウィンドウ規定についての別な理由は、テキストを右から左へス
クロールすること、又は左から右へスクロールすること(例えば、アラビア文字
)が、可能な限り小さなウィンドウで出来る限り早期に検出しうることである。
hwindow_stop_left>hwindow_start_right及びvwindow_stop_top>vwindow_stop
_bottomを作成することによって、4つのウィンドウが1つに組み合わされる。
【0024】 簡易な実施において、ピーク検出器Pは、測定ウィンドウの最大輝度レベルを
容易に検出する。
【0025】 テキスト検出器は、ビデオ信号内において大きくかつ速い遷移を検出する。こ
れを成し遂げるには、様々な方法がある。或る実施例では、2つの閾値(ここで
も低い閾値、高い閾値)を双方とも輝度が交差する場合を検出する「イベント検
出器」が使用される。双方の閾値が、順に交差される場合のみ、当該出力は、予
め決定された時間高くなるだろう。
【0026】 次の実施例は、第3検出器(閾値/速度検出器)を有しており、この検出器は
、閾値の交差で調べるだけでなく、遷移について可能な時間の制限を設定する。
このようにして、遷移の振幅及び速度の双方が考慮に入れられる。
【0027】 動きテキストの最大速度は、かなり高くなりうる。テキストが、スクリーンを
2秒で交差する場合、100フィールドに約800画素、すなわち、1フィール
ド当たり8画素を意味する。このような速度を伴うと、検出器は、テキストが非
動きであると間違って示して、間違った遷移にロックしてしまう可能性がある。
この理由のために、上昇及び下降する遷移について異なる出力を与えるために検
出器を次のように拡張した。すなわち、0=下降エッジ検出,1=エッジなし,及び
2=上昇エッジ検出である。
【0028】 新しい検出器が、以下で説明されるだろう。
【0029】 閾値/峻度検出器は、輝度信号が低い閾値又は高い閾値を交差する際に検出を
行う。この結果は、2つの1ビット信号である。当該結果は、3つのサンプルを
含むことができるシフトレジスタに記憶される。
【0030】 次のステップにおいて、双方の閾値が3個の画素内で交差されたか否かを測定
する。3個前の画素からの1ビット信号を、現在のビット信号と比較することに
よって、上記ステップを実行する。この場合、以下の3つを行う。
【0031】 輝度信号が、HIGHからLOWへ進む(まず高い閾値が交差され、更に3個の画素
内で低い閾値が同様に交差される)場合、出力信号を0とする。
【0032】 輝度信号が、LOWからHIGHへ進む(まず低い閾値が交差され、更に3個の画素
内で高い閾値が交差される)場合、出力信号を2とする。
【0033】 他の全ての場合、出力信号を1とする。
【0034】 メモリにおけるエッジ情報の記憶については、ラインメモリLMがプロセッサCP
のローカルキャッシュに位置されうると見なす。フィールドメモリFMは、外部の
(SD)RAMになければならず、従ってメモリ帯域幅に影響を及ぼすだろう。エッジ
検出EDは、1画素当たり2ビットのみを必要とするので、4個の画素のエッジ検
出器出力を1バイトにパックすることが可能である。ハードウェア実施において
、パック/アンパックは、極めて低価格ですむので、この場合メモリの利得の方
がまさるであろう。
【0035】 相関器Cは、以下のように動作する。上記で説明された検出器EDは、テキスト
文字が始まる又は終わる(出力0又は2)高い確率がある位置の画素を認識する
。相関器Cの目的は、画素がテキストに対応するか否かを確認することであり、
テキストを取り扱う場合は、該テキストが静止しているか又は動いているかを確
認することである。これを行うために、相関器Cは、現在のラインに関する検出
器EDの出力refoを、同じフィールドの空間的に2本ライン前の検出器EDの出力re
fpp1と、更に前のフィールドの1本ライン前の検出器EDの出力refpp2と比較する
【0036】 まず第1に、テキストが存在するラインでは、一般的にテキスト幅全体にわた
って0又は2において検出器出力の相対的に高い集中がある。テキストが存在す
ると見なす場合、殆どの場合において、テキストの限界が1とは異なる検出器の
最初及び最後の出力に対応するだろうと考えられうる。従って検出器の出力から
、テキストの長さを決定することができる。このデータは、更にテキスト識別に
必要な0及び2における検出器の出力数について閾値を設定するために使用され
る。
【0037】 テキスト文字の大部分は、小さな垂直ラインを含みがちであるという事実が考
慮に入れられている。従って、テキストが存在する場合、連続するラインについ
て検出器EDの出力間に多くの類似点が見込まれる。
【0038】 テキストが静止している場合、現在のラインに対する検出器EDの出力refoは、
同じフィールドで空間的に2本ライン前の検出器EDの出力refpp1よりも、先行す
るフィールドの1本ライン前の検出器EDの出力refpp2の方によりうまく整合しや
すい。インタレースされたビデオ信号において、refpp1は、refoを考慮して同じ
フィールドの先行するラインに関連する。
【0039】 これに反して、テキストが動いている場合、現在のラインに対する検出器EDの
出力refoは、先行するフィールドの空間的に1本ライン前の検出器EDの出力refp
p2よりも、同じフィールドの空間的に2本ライン前の検出器EDの出力refpp1の方
がよりうまく整合しやすい。
【0040】 静止テキストは、フィールドn-1のラインm-1からフィールドnのラインmまでに
整合する遷移の周波数が、フィールドnのラインm-2からフィールドnのラインmま
でに整合する遷移の周波数に匹敵することを特徴とする。動くテキストは、フィ
ールドn-1のラインm-1からフィールドnのラインmまでに整合する遷移の周波数が
、フィールドnのラインm-2からフィールドnのラインmまでに整合する遷移の周波
数よりかなり低いことを特徴とする。
【0041】 テキスト動作の速度を見出すメカニズムが、テキスト検出器に付け加えられる
ことが可能である。現在のラインについての検出器の出力が、先行するフィール
ドの1本ライン前の検出器の出力に対してどの程度整合するのかを算出するため
に、アレイrefpp2[]のインデックスをシフトすることによって、検出器の出力
に正しい動き補償を与える場合、動きテキストは、相関器により静止テキストと
して見られるだろう。テキストの速度は、このときreffp2[]のインデックスの
シフトに対応する。
【0042】 検索メカニズムは、静止テキストを探し始める。動きテキストが検出されると
、速度は、1画素/ラインだけ加速される。後に続くテキストラインについては
、現在のラインの検出器EDの出力refoが、先行するフィールドの空間的に1本ラ
イン前の検出器の出力refpp2に対してどの程度整合するのかの算出は、1画素の
動き補償を考慮に入れている。相関器Cが依然として「動きテキスト」を示す場
合、次のテキストライン検出について速度が1画素だけ更に加速される。正しい
速度に到達すると、速度*ライン後に相関器が「静止テキスト」を示しているこ
とを意味する。このプロセスにより、数本のライン中におけるその動き速度及び
テキストを検出することが可能になる。
【0043】 検索メカニズムは、「静止テキスト」位置(速度=0)から始まるので、適切
に収束する速度検索のために、テキストがどの方向に動いているのかを知ること
が問題となる。ある画像に到来するテキストが、十分に素早く検出されるとみな
す場合、このテキストが最初に検出されるウィンドウに依存して、当該テキスト
がスクリーンの右から来るのか、又は左から来るのかがわかる。その場合、テキ
ストのスクロールする方向もわかる。別の可能性は、2つの連続するフィールド
にわたって、テキストとして検出された最初の画素からの情報と、テキストとし
て検出された最後の画素からの情報を比較することであろう。
【0044】 本発明の1つの態様は、以下の如く要約されうる。ビデオにおいて、テキスト
、とりわけ水平にスクロールするテキストは、動き補償された処理(例えば、1
00ヘルツ変換)に極めて感度が高い。本発明の好ましい実施例は、エッジ検出
器ED及び相関器Cにより、テキストを検出することと、静止しているか又は動い
ているかを決定することとを可能にする。特定の実施により、テキストの速度、
その高さ、又はその長さ、及びスクリーンにおけるテキストの位置などの追加の
情報も得ることができる。この原理は、reffp2からのデータが、refo及びreffp1
よりも異なる時間(フィールド/フレーム)に適用されるならば、インタレース
された信号及び順次信号の双方に働く。本発明は、テキスト検出に広くは関して
おり、テキスト検出のスクロール(但し、動きテキスト検出が好適な実施例では
あるが)、又は、フィルムモードの背景でのビデオモードテキストの検出(但し
、本発明は当該用途にとりわけ有用であるようだが)に限定されない。
【0045】 上述された実施例は、本発明を限定せずに説明していることに留意されたい。
当業者であれば、添付請求項の範囲から離れることなく、様々な代わりの実施例
を設計することが可能であろう。請求項において、括弧内に付されたいかなる参
照符号も当該請求項を限定するものとして解釈されるべきではない。「有する(c
omprising)」という動詞の使用が、この特許請求の範囲に記された以外の他のス
テップ又は構成要素の存在を除外するものではない。構成要素の前に付く冠詞で
ある「a」又は「an」の使用も、斯様な構成要素が複数存在することを除外する
ものでもない。「フィールド」という単語は、インタレースされたビデオ信号及
び順次ビデオ信号の双方に適用可能である。「垂直に隣接する位置」は、同じフ
ィールド内にある必要はなく、当該位置は、ある程度なら傾斜したライン上にあ
りうるため、又は、先行するフィールドからのエッジ検出結果の水平位置が現在
のフィールドからのエッジ検出結果の水平位置から異なることも可能なので、純
粋に垂直ライン上にある必要はない。本発明は、複数の別個の構成要素を有する
ハードウェアにより、及び適切にプログラムされたコンピュータにより実施され
ることが可能である。複数の手段を列挙する装置請求項において、これら手段の
幾つかは、ハードウェアの同一アイテムにより具体化されることができる。或る
手段が、相互に異なる従属請求項で再引用されている単なる事実は、これら手段
の組み合わせが効果的に使用されることはできないということを示すわけではな
い。
【図面の簡単な説明】
【図1】本発明による動きテキスト検出器の第1実施例を有する表示装置を
示す。
【図2】本発明による動きテキスト検出器の第2実施例を示す。
【図3】本発明の好ましい実施例を使用するための測定ウィンドウの規定を
示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ニューウェンヒューゼン ミシェル ダブ リュー オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 (72)発明者 ケッテニス ジェローエン エム オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5C021 PA58 PA78 RA01 RA02 RA12 RA14 RA15 RA16 RB05 SA21

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】ビデオ信号のテキストを検出する方法であって、前記方法は、 水平エッジ検出結果を得るために、前記ビデオ信号の高域水平周波数を検出す
    るステップと、 所与の位置における水平エッジ検出結果を、垂直に隣接する位置における水平
    エッジ検出結果と相関させるステップとを有する方法。
  2. 【請求項2】遷移を示す水平エッジ検出結果の密度を測定するステップを更
    に有する、請求項1に記載の方法。
  3. 【請求項3】静止テキストを動きテキストと識別するために、フィールド内
    遷移整合周波数をフィールド間遷移整合周波数と比較するステップを更に有する
    、請求項1に記載の方法。
  4. 【請求項4】ビデオ信号のテキストを検出する装置であって、前記装置は、 水平エッジ検出結果を得るために、前記ビデオ信号の高域水平周波数を検出す
    る手段と、 所与の位置における水平エッジ検出結果を、垂直に隣接する位置における水平
    エッジ検出結果と相関させる手段とを有する装置。
  5. 【請求項5】表示装置であって、 請求項4に記載のビデオ信号のテキストを検出する装置と、 前記テキスト検出装置の出力に依存して、前記ビデオ信号を動き補償処理する
    動き補償プロセッサと、 前記動き補償プロセッサの出力を表示するディスプレイとを有する表示装置。
JP2001573777A 2000-03-31 2001-03-22 テキスト検出 Withdrawn JP2003530028A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00201183.1 2000-03-31
EP00201183 2000-03-31
PCT/EP2001/003363 WO2001076231A2 (en) 2000-03-31 2001-03-22 Text detection

Publications (1)

Publication Number Publication Date
JP2003530028A true JP2003530028A (ja) 2003-10-07

Family

ID=8171290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001573777A Withdrawn JP2003530028A (ja) 2000-03-31 2001-03-22 テキスト検出

Country Status (6)

Country Link
US (1) US6842537B2 (ja)
EP (1) EP1277337A2 (ja)
JP (1) JP2003530028A (ja)
KR (1) KR20020027332A (ja)
CN (1) CN1181668C (ja)
WO (1) WO2001076231A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100537520B1 (ko) * 2004-02-18 2005-12-19 삼성전자주식회사 동영상의 자막 검출 방법 및 장치
TWI286026B (en) * 2004-04-09 2007-08-21 Mstar Semiconductor Inc Method of processing fields of images and related device for data lines similarity detection
WO2006051482A1 (en) * 2004-11-15 2006-05-18 Koninklijke Philips Electronics N.V. Detection and modification of text in a image
EP1840798A1 (en) * 2006-03-27 2007-10-03 Sony Deutschland Gmbh Method for classifying digital image data
US8917935B2 (en) 2008-05-19 2014-12-23 Microsoft Corporation Detecting text using stroke width based text detection
US8718366B2 (en) * 2009-04-01 2014-05-06 Ati Technologies Ulc Moving text detection in video
KR101975247B1 (ko) * 2011-09-14 2019-08-23 삼성전자주식회사 영상 처리 장치 및 그 영상 처리 방법
CN102750540B (zh) * 2012-06-12 2015-03-11 大连理工大学 基于形态滤波增强的最稳定极值区视频文本检测方法
WO2015038749A1 (en) 2013-09-13 2015-03-19 Arris Enterprises, Inc. Content based video content segmentation
US9842281B2 (en) 2014-06-05 2017-12-12 Xerox Corporation System for automated text and halftone segmentation

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2623040B1 (fr) 1987-11-09 1990-02-09 France Etat Procede et dispositif de traitement de signaux d'image a balayage de trame entrelace
US5138451A (en) * 1988-10-12 1992-08-11 Hitachi Ltd., Hitachi Video Engineering, Inc. Television receiver
JP2732650B2 (ja) 1989-02-28 1998-03-30 株式会社東芝 垂直エッジ検出回路
KR920002274B1 (ko) * 1989-03-30 1992-03-20 삼성전자 주식회사 운동 보상회로
GB9303369D0 (en) 1993-02-19 1993-04-07 Philips Electronics Uk Ltd Identifying film frames in a video sequence
US5416532A (en) * 1993-03-17 1995-05-16 Samsung Electronics Co., Ltd. Adaptive video peaking circuitry using cross-faders
DE4440661C2 (de) 1993-12-08 1996-02-15 Rundfunkschutzrechte Ev Bewegungsdetektionsverfahren für ein Vollbild und Bewegungsdetektor zur Durchführung des Verfahrens
FI97663C (fi) 1994-06-10 1997-01-27 Nokia Technology Gmbh Menetelmä liikkeen tunnistamiseksi videosignaalista
KR0157480B1 (ko) * 1994-06-18 1998-11-16 김광호 화상처리에서 에지방향에 적응하는 휘도신호와 색신호 분리방법 및 회로
EP0720114B1 (en) * 1994-12-28 2001-01-24 Siemens Corporate Research, Inc. Method and apparatus for detecting and interpreting textual captions in digital video signals
US5745596A (en) * 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5852678A (en) * 1996-05-30 1998-12-22 Xerox Corporation Detection and rendering of text in tinted areas
JP3363039B2 (ja) * 1996-08-29 2003-01-07 ケイディーディーアイ株式会社 動画像内の移動物体検出装置
US5936676A (en) * 1997-08-21 1999-08-10 Miranda Technologies Inc. Apparatus and method for line interpolating an interlaced video signal
US6298157B1 (en) * 1998-02-27 2001-10-02 Adobe Systems Incorporated Locating and aligning embedded images
US6181382B1 (en) * 1998-04-03 2001-01-30 Miranda Technologies Inc. HDTV up converter
US6285801B1 (en) * 1998-05-29 2001-09-04 Stmicroelectronics, Inc. Non-linear adaptive image filter for filtering noise such as blocking artifacts
US6185329B1 (en) * 1998-10-13 2001-02-06 Hewlett-Packard Company Automatic caption text detection and processing for digital images

Also Published As

Publication number Publication date
WO2001076231A2 (en) 2001-10-11
US20010050725A1 (en) 2001-12-13
WO2001076231A3 (en) 2002-01-31
CN1181668C (zh) 2004-12-22
EP1277337A2 (en) 2003-01-22
KR20020027332A (ko) 2002-04-13
CN1366763A (zh) 2002-08-28
US6842537B2 (en) 2005-01-11

Similar Documents

Publication Publication Date Title
CN100396087C (zh) 能够检测滚动文本和图形数据的运动估计装置、方法及机器可读介质
US7346109B2 (en) Motion vector computation for video sequences
US8335257B2 (en) Vector selection decision for pixel interpolation
US9036082B2 (en) Method, apparatus, and system for line-based motion compensation in video image data
US9444977B2 (en) Method and device for adaptive noise measurement of a video signal
CN101946507B (zh) 视频显示装置
US8947600B2 (en) Methods, systems, and computer-readable media for detecting scene changes in a video
EP2180695A2 (en) Apparatus and method for improving frame rate using motion trajectory
CN101193253A (zh) 内插帧生成方法和内插帧生成设备
JP2003530028A (ja) テキスト検出
US9148583B2 (en) Flicker detection method and flicker detection apparatus
US9167175B2 (en) Flicker detection method and flicker detection apparatus
JP2006215655A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP5188272B2 (ja) 映像処理装置及び映像表示装置
US8331676B2 (en) Image processing apparatus and method, and program
KR100351160B1 (ko) 영상 움직임 보상 장치 및 방법
JP2008035436A (ja) プルダウンシーケンス検出装置およびプルダウンシーケンス検出方法
US20130201404A1 (en) Image processing method
KR100574503B1 (ko) 필름모드 판별장치 및 그 방법
JPH1097632A (ja) 物体の移動追跡方法
KR100304653B1 (ko) 모션 검출장치
JP2006217066A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP2010041234A (ja) フレーム補間装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080319

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090203

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090317