JP2004530214A - テキスト弁別方法及び関連する装置 - Google Patents

テキスト弁別方法及び関連する装置 Download PDF

Info

Publication number
JP2004530214A
JP2004530214A JP2002592049A JP2002592049A JP2004530214A JP 2004530214 A JP2004530214 A JP 2004530214A JP 2002592049 A JP2002592049 A JP 2002592049A JP 2002592049 A JP2002592049 A JP 2002592049A JP 2004530214 A JP2004530214 A JP 2004530214A
Authority
JP
Japan
Prior art keywords
background
line
text
segment
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002592049A
Other languages
English (en)
Inventor
フェデリコ,リッカルド ディ
カッラーイ,パオラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004530214A publication Critical patent/JP2004530214A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00007Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to particular apparatus or devices
    • H04N1/00018Scanning arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00082Adjusting or controlling
    • H04N1/00087Setting or calibrating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00092Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to the original or to the reproducing medium, e.g. imperfections or dirt

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本発明は、電子的に生成された画像のラインを走査するテキスト弁別方法であって、走査された画像ラインの背景セグメントを推定し、非背景セグメントが画像のテキスト部を構成するかどうかを判定するために推定背景セグメントと非背景セグメントの間の差を解析する方法を提供する。

Description

【0001】
本発明は、電子的に生成された画像内でテキストと背景を弁別する方法であって、テキストセグメントと背景セグメントを識別するために画像の各ラインを走査する段階を含む方法に関する。
【0002】
電子視覚ディスプレイ装置は、特に情報技術分野に幅広い用途がある。例えば、コンピュータで生成された画像では、画像を特定の表示要件に適合させるために画像データを処理することが必要となる場合がしばしば生ずる。
【0003】
例えば、特に固定の画素寸法を与えるLCD装置では、ディスプレイに関連するグラフィックカードから与えられる入来RGB信号の画像フォーマットを変換することが必要となりうる。このようなディスプレイは、一般的には、適切な同期、フレームレート変換、色/輝度/コントラストの調整、及び、上述のように画像形式の変換を行うよう入来RGB信号を適合する役割を果たすICコントローラを一般的に使用する。例えば、グラフィックカードがLCD視覚ディスプレイ装置によってサポートされるのとは異なる画像形式を生成する役割を果たす場合、LCDによって与えられる特定の解像度に信号を適合させるために、一般的にはズームといった何らかの形の適合が行われねばならない。詳細には、LCDは1024×768画素の本来の解像度を有し、一方、おそらくは800×600又は640×1024画素の標準VGAモードのみをサポートする比較的古いグラフィックカードが与えられるとすると、画像は、水平方向に640画素から1024画素へ、垂直方向に480画素から768画素へズームされねばならないことが認められ得る。このようなズームは、一般的には、入力信号を再サンプリング及びフィルタリングすることによって達成される。これは、不利には、例えばテキストといった意図される鮮鋭なエッジの周辺で特に顕著であるボケを画像に導入する。
【0004】
もちろん、このようなボケは、テキストの処理に専用の画像処理配置の採用によって防止されうることが認められる。するとテキスト画像の必要な鮮鋭さは保たれるが、このような特別なテキストスケーリングアルゴリズムは、他の画像内容、例えば画像の背景又は写真部分に対して適切には機能せず、したがって、かかる配置は、画像ないでテキストセグメントと背景セグメントを正確に弁別する手段が有利に使用されうる一つのシナリオを与える。分けられたテキスト部分と背景画像部分は、有利には、ズームされた画像が元の画像の全ての適切な鮮鋭さ及びコントラストを保つよう、適切な夫々のスケーリングアルゴリズムによって別々に処理されうる。
【0005】
また、従来のICコントローラは、画像全体に同じ処理関数を適用する傾向がある。このようにして、単一のフィルタは、テキスト/グラフィックスの鮮鋭さの保存と、自然な内容の領域のエイリアシングされない平滑さの間の妥協を与えねばならない。より最近のICコントローラは、低域通過フィルタ配置により鮮鋭なエッジと仮定された自然な部分とについて区別された処理段階を採用しており、かかる区別は、通常は局所的なコントラストの評価に基づいてなされる。しかしながら、続く処理は、単純に2つの線形フィルタ間で切り換えることによって行われ、いずれの続く処理努力も画素毎にテキストを識別しようとするものではない。
【0006】
米国特許第5,048,096号は、例えば、続く光学文字認識処理で支援するよう画像から非テキストのものを除去し、単一の線を形成する画素が各線のうちのテキスト画像の部分を形成する画素を識別するよう調べられるいわゆるランレングス解析を用いる処理が開示される。
【0007】
しかしながら、このような配置は、不利なことに、1つ以上のテキスト色を検出しうる、又は画像の水平方向に生ずる背景反転を処理しうる方法に関して制限されている。更に、このような公知の方法に関して生ずるハードウエア要件は制限のあるものであるとわかる。
【0008】
本発明は、視覚ディスプレイ装置を駆動するビデオ信号と共に使用される改善されたテキスト弁別方法及び装置を提供することを目的とする。本発明は、独立項によって定義される。従属項は、有利な実施例を定義する。
【0009】
本発明の1つの面によれば、電子的に生成された画像のための、画像のラインを走査する段階を含むテキスト弁別方法であって、走査される画像ラインの少なくとも1つの背景セグメントを推定し、推定された非背景セグメントが画像のテキスト部分を形成するかどうかを判定するために少なくとも1つの推定された背景セグメントと推定された非背景セグメントの間の差分を解析することを特徴とする方法が提供される。
【0010】
本発明は特に、単一のメモリラインといった少ないハードウエア資源と及び限られた計算を必要とする一方で、演算の適切な速度と正確さを達成する点で特に有利である。
本発明は、有利には、ディスプレイの同じ領域内に隣接する場所で見つけられるときでも、一色以上のテキスト部分の検出を可能とする。各画像ラインの水平方向に生ずる背景反転は、従来技術に対して利点を示す方法で処理されうる。
【0011】
本発明によって提供される有利には適切なアルゴリズムによって達成される処理では、テキストが存在する画像の領域を識別するだけでなく、より重要には、画像のどの画素がテキストのセグメントを形成するかを識別することが可能である。有利には、判定されたテキスト画素の実際の位置では、改善された画素繰り返し手順が適用されえ、これは、元のコントラストと鮮鋭さが有利に保存されるよう、従来の線形フィルタリングとは異なり、処理された画像にグレーレベルを導入しないため、特にパワフルな方法でテキスト画像をスケーリングすることが可能である。
【0012】
もちろん、本発明は、画像のテキスト部分を背景部分とは別に処理するときに、特に、テキスト画像の鮮鋭さ及びコントラストを保存するために何らかの形のズーム操作が必要とされるときに有利であるとされる様々な状況で使用されうることが認められる。
【0013】
請求項2、3及び4に記載の特徴は、方法の正確性を維持しつつ、単一のメモリラインのみのハードウエア要件を維持する点で特に有利である。
【0014】
請求項5に記載の特徴は、非背景セグメントであると判定された画像ラインのどのセグメントが再び正確にテキストセグメントを構成するかを判定されうるかを確認する特に正確で単純な方法を提供するという利点がある。
【0015】
請求項6の特徴は、背景弁別を達成するための特に有利で簡単な手段を提供し、請求項7記載の特徴は、写真又はグラフィック画像と共に生成されるような高いコントラストの背景領域を有する画像を解析するときに特に有利であることが示される。
【0016】
従って、本発明は、アルゴリズム中で具現化され得、例えばコンピュータで生成された画像内に見つけられるテキストを画素毎に検出するよう配置されうる。このような検出は、知覚されるテキストセグメントと推定される背景セグメントの間のコントラストの差分を解析することによって行われ、ライン毎に行われる背景推定手順は、背景推定ラインバッファを背景を表すのに十分に均一で長いと判定された現在入力ラインの部分で更新することに基づく。テキストは、有利には、他の画像領域とは異なる方法で、例えばモニタスケーラ、コンピュータで生成されたテキスト画像の光学文字認識、又は画像編集プログラムのズーム特徴等で処理されうる。
【0017】
本発明の上述及び他の面は、以下説明する実施例から明らかとなるであろう。以下、本発明について、例としてのみ添付の図面を参照して説明する。図1を参照するに、例えば画像捕捉装置14においてYUV又はRGB入力ビデオ信号12を受信し、続いて画像捕捉装置14がYUV・RGB変換器16へ信号を与えるよう配置されたICコントローラ処理チェーン10を示すブロック図が示されている。RGB変換器16から出力される信号は、フレームメモリ22にインタフェース接続されたフレームレート変換ユニット20へ与えられる。信号は、フレームレート変換ユニット20からスケーリングエンジン24へ与えられ、スケーリングエンジン24は、図示の実施例では、図2に関して後述するように本発明に従って動作するよう配置されるテキスト検出器を含む。このスケーリングエンジンの出力は、全ての明るさ/コントラスト制御を行うガンマ補正ユニット26へ与えられる。
【0018】
上述のように、本発明の方法は、図示の例では、ICコントローラ10のスケーリングユニット24内にその機能的な位置をおくアルゴリズムに具現化される。このように、スケーリングユニット24は、画像フォーマット変換を行うのに役立つ。
【0019】
RGB入力信号12は、図1に示す処理チェーン14乃至26によって各ラインが順番に処理されるよう、ライン毎にICコントローラ10へ与えられる。このチェーンは、各セクションが、色変換、デインタレース、フレームレート変換、画像フォーマット変換、及びカメラ補正等の画像の特定の特徴に影響を与えるか又は適合させるよう作用する処理ルートを形成する。上述のように、フォーマット変換は、スケーリングエンジン24によって有利に達成され、図示の実施例では、画像全体の必要な処理を達成するよう、画像のテキストセグメントが非テキストセグメントから分けられ、2つの分けられた部分が夫々のスケーリングアルゴリズムによって処理される2ステップ処理であると考えられうる。
【0020】
このような処理について、図1のスケーリングエンジン24をより詳細に示す図2を参照して更に説明する。スケーリングユニット24は、図1のフレームレート変換ユニット20から入力信号28を受信するよう配置され、この信号は次に、本発明を具現化するアルゴリズムの機能的な場所を与える信号分割ユニット30及びテキスト検出器ユニット32の両方へ与えられる。このような動作方法を考慮して、テキスト検出器ユニット32は、ここでは信号分割ユニット30を駆動するためにも作用する背景推定ラインテキスト検出器32と称される。明確に示すと、背景推定ラインテキスト検出器32への入力はフレームレート変換ユニット20から与えられた画像ラインを含み、背景推定ラインテキスト検出器32の出力はそのラインの各画像に対するテキスト/非テキストの決定を表わす2値信号を含む。背景推定ラインテキスト検出器32の入力は、データがそこから読み込まれるラインバッファを含んでもよく、出力は同じ長さの2値バッファ(図示せず)によって形成されてもよい。しかしながら、本発明によって与えられる処理は、出力が、各素子の二進値が各対応する画素のテキスト・非テキストの決定を示すラインバッファであるか、或いは、所定数の画素の一定の遅延を導入することが必要であれば特に有利でありうるビットストリームであるよう、実施されうることが認められよう。実際に、背景セグメントが認識され、最後の導関数閾値切り換えから最少の所定の数の画素の後、背景推定ラインバッファへ複製されえ、背景セグメントは、以下説明するように次の導関数閾値切り換えが達成されるまで、画素毎に連続される。しかしながら、所定の最少画素数よりも大きい長さを有することがわかっているバッファが図1の処理ルートに導入されれば、このような操作は必要に応じて必要なときに達成されえ、それにより画素毎の遅延された決定を可能とする。しかしながら、図示の例では、出力されるとともに検出ライン全体が計算される。
【0021】
本発明を具現化する特定のアルゴリズムに関して以下更に説明するように、本発明の主な特徴は、推定された背景セグメントのライン毎の連続的な更新に関する。元の画像の各ラインに対して、十分に均一であり幅広い部分は推定背景として識別され、背景推定ラインバッファ内の当該の位置へ複製される。最終画像は、完全な、しかしテキストのない画像を与えるよう、推定背景ラインを組み合わせることによって形成されうる。画像の各ラインに対して、元の画像の輝度は対応する位置における背景推定ラインの輝度と比較され、輝度の差が各画素に対する所定の閾値を超える場合、特定の画素はテキスト画素としてフラグが付される。
【0022】
図1及び図2のブロック図に示すように、本発明を具現化するアルゴリズムは、ICコントローラ10の処理ルート内に特定の適用を見いだし、入力画像信号は、背景推定ラインテキスト検出器32内で動作する推定ラインアルゴリズムの出力に基づいて2つの別の信号部分へ分割される。図2を特に参照して、分割されたテキスト及び背景データは、夫々のスケーリングユニット34(テキスト)、36(背景)で異なる夫々のアルゴリズムによって処理され、このようなスケーリングされた信号は、図1のガンマ補正ユニット26へ与えられる出力信号40を与えるよう組合せユニット38において組み合わされる。分けられたテキスト信号と背景信号は、スケーリングユニット34、36内の適切な夫々のアルゴリズムによってスケーリングされているため、組み合わされた信号40は、コントラストと鮮鋭さに関して元の画像と同じであるスケーリングされた画像を生成しうる。
【0023】
しかしながら、推定背景は単にテキストの検出のために使用されるものであって、スケーリングエンジンのための入力を与えるものではないことが認識されるべきである。むしろ、実際の背景は、検出されたテキストを捕捉し、次に隣接する画素から欠落した画素を外挿することによって抽出されうる。
【0024】
ここで図3を参照するに、本発明を具現化するアルゴリズムが、続く背景推定ライン更新の必要とされる背景推定及び続くテキスト検出を達成しうる方法を示す役割を果たすフローチャートが示されている。
【0025】
アルゴリズムは、1ライン状態レジスタを用いる走査ライン解析に基づく。図示の実施例は、図示の実施例は、一般的にテキストは性質が均一(一つの色)であるかグラフィック/写真的である背景に囲まれるという前提から始まる。ライン毎に画像を走査する場合、ライン内の背景領域を推定し更新することができる。次に、テキストは、推定される背景に対するコントラストの差を解析することによって推定される。テキストは水平方向を有するため、一般的に背景ラインはテキストラインに先行する。これに基づいて、テキストを解析するとき、現在の背景推定は正確な値を保持する可能性が高い。背景推定の手順は、以下の通りに動作し、以下概説するアルゴリズムの実施例のMatlabコード表現に関連する。
【0026】
まず、アルゴリズムの状態レジスタとして動作する背景推定ライン(BEL)は、背景が検出されなかったことを示す従来の値(−1)で初期化され、即ち、
bel=−1*ones(1,w)
と書くことができ、但し、wは画像幅であり、関数「ones()」は1を含むラインベクトルを形成する。
【0027】
第2に、画像の各ラインに対して、背景として分類されうるセグメントの選択が行われる。上述のように、各セグメントは、十分に幅が広く、均一であり、低い輝度変化を示されねばならない。これらの条件は、推定されるセグメントの長さに対する閾値(minL)、及び、各セグメントの最大導関数に対する閾値(maxD)を夫々設定することによって行われうる。minLよりも長いセグメントが絶対値としてのmaxDよりも高い2つの導関数ピークで囲まれている場合、このセグメントはBEL上に複製されることにより、前の推定値を更新する。BELの残る部分は、前の値を保持し、それにより最後の有効な推定値を伝える。
【0028】
閾値maxDを設定するとき、あまりに高すぎる値は、背景セグメントに幾らかの低いコントラストのテキストを含みうる一方で、低すぎる値は写真をテキストとして認識することにより失敗を導きうることが認められるべきである。
【0029】
例えば、アンチエイリアシングされたテキストといった幾つかの場合、2つの連続する輝度は背景を例えば薄い灰色へ又は薄い灰色を濃い灰色へインクリメント又はデクリメントし、又はその逆が確認されうる。しかしながら、これらの差はmaxDよりも高くとも、背景セグメントの始まりとしては解釈されるべきではない。従って、このような包含を防止するために、更なる条件が課せられうる。即ち、条件を満たすセグメントはBELの内側の対応する位置へ複製される一方で、背景の他の部分に対しては前の有効な推定値が保持される。
【0030】
背景として分類されていないセグメントについては、背景の前の推定値との比較が行われる。推定された背景に対して十分なコントラストを示すと判定された画素は、テキストとして識別される。
【0031】
例を更に詳細に示すため、本発明を具現化するアルゴリズムのMatlabコード表現を以下に示す。
//最少背景セグメント長
minL=35;
//背景切換えに対する最小導関数
maxD=60;
//Dは、差分ベクトルの寸法を輝度のものと一貫するようゼロでパディングされた入力
//輝度の水平差分ベクトルである
D=([diff(lum(i,:))0]);
//以下の演算は、背景セグメントの始まり又は終わりであると考えられるべき導関数に
//ついての条件を満たす輝度ベクトルの画素のインデックスでベクトルfDを埋める。
//これらは、
//画素に関連付けられる導関数の絶対値がmaxDよりも高くなくてはならない:
//abs(D)>maxD
//導関数の連続する高い値は、同じ符号であるときは、背景の一部と考えられる。
//幾つかの場合、例えばアンチエイリアシングされたテキストの場合、2つの連続する
//及び同様の輝度のインクリメント又はデクリメント(背景から薄い灰色へ、及び、薄
//い灰色から濃い灰色へ、並びに、その逆)が見いだされうる。
//これらの差分がmaxDよりも高くとも、これらは背景セグメントの始まりであると
//解釈されてはならない。従って、十分に高いことのほかに、その前又はその後のもの
//と異なる符号を有する導関数を背景セグメントの有効な始まり/終わりとして考慮し、
// ...D./[[D(2:w)D(w)]+0.0001]<0...及び...
//D./[[D(1)D(1:w−1)]+0.0001]<0...
//又は
//前のもの又は後のものよりもはるかに高く、
// ...D.[[D(2:w)D(w)]+0.0001]>th_step...
//(全ての除算は、要素毎のベクトル除算であり、0.0001はゼロによる除算を防
//止するためである)である。
//
//ベクトルfDは、ラインの始まりと終わりがセグメントの端であると考えられねばな
//らないことを意図して、1(前)とw(後)でパディングされる。
// [1find(ab... ...<0))w];
fD=[1find(abs(D)>maxD&(D./[[D(2:w)D(w)]+0.0001]>th_step|D.[[D(2:w)D(w)]+0.0001]<0)&(D./[[D(1)D(1:w−1)]+0.0001]>th_step|D./[[D(1)D(1:w−1)]+0.0001]<0))w];
//以下の演算は、導関数ピークと続くものの間の距離(画素単位)を計算する
//(尚、fDは導関数ピークのインデックスを含むベクトルである)。
DfD=diff(fD);
//ここで、背景セグメントであると考えられるのに十分に長いセグメントを選択しうる。//fDfDは、セグメントのDfD内のインデックスがminLよりも長いことを表わす。
fDfD=find(DfD>minL)。
【0032】
ここで、図4Aを参照するに、この通常の表示に従ってコンピュータ画面上に予想されうる元の画像の例を示し、図4Bは、テキスト部分と非テキスト部分を弁別するようグラフィックカードからの信号がいったん本発明に従って処理された後の同じ表示を示す図である。ここでの表示は、テキスト部分が除去されたものを表わす。テキスト部分自体は、図4C似示す検出出力画像信号中に見つけることができる。
【0033】
尚、上述の実施例は、本発明を制限するものではなく、当業者は、添付の請求の範囲を逸脱することなく多くの他の実施例を設計することが可能である。請求の範囲では、括弧内に示す参照番号は請求の範囲を制限するものと理解されるべきではない。「含む」という後は、請求の範囲に記載された要素又は段階以外のものが存在することについて排除するものではない。要素が単数形で記載されている場合は、かかる要素が複数個存在する場合について排除するものではない。本発明は、幾つかの別個の要素を含むハードウエア、及び適切にプログラミングされたコンピュータによって実施されうる。幾つかの手段を列挙した装置に関する請求項では、これらの手段のうちのいくつかはハードウエアの同一のアイテムによって具現化されうる。互いに異なる従属項に幾つかの手段が記載されているということだけでは、これらの手段が都合良く利用され得ないということを示すものではない。
【図面の簡単な説明】
【0034】
【図1】本発明が使用されうるICコントローラ処理チェーンを示すブロック図である。
【図2】図1に示され、本発明を具現化するテキスト検出器が使用される、スケーリングエンジンを示すブロック図である。
【図3a】図2に示されたテキスト検出器内で用いられる処理を示すフローチャートである。
【図3b】図2に示されたテキスト検出器内で用いられる処理を示すフローチャートである。
【図4A】元のVDU画像と、テキストが検出され除去された推定背景VDU画像と、本発明の実施例による検出されたテキストを含む検出出力画像との差を示すために、元のVDU画像を示す図である。
【図4B】元のVDU画像と、テキストが検出され除去された推定背景VDU画像と、本発明の実施例による検出されたテキストを含む検出出力画像との差を示すために、推定背景VDU画像を示す図である。
【図4C】元のVDU画像と、テキストが検出され除去された推定背景VDU画像と、本発明の実施例による検出されたテキストを含む検出出力画像との差を示すために、検出出力画像を示す図である。

Claims (13)

  1. 画像のラインを走査する段階を含む、画像用のテキスト弁別方法であって、
    前記画像ラインの少なくとも1つの背景セグメントを推定する段階と、
    非背景セグメントが前記画像のテキスト部の部分を形成するかどうかを判定するよう前記少なくとも1つの背景セグメントと非背景セグメントの差を解析する段階とを含む方法。
  2. 続くラインの背景セグメントが推定されるときに更新されるよう配置される記憶手段の中に前記推定された背景セグメントを格納する段階を含む、請求項1記載の方法。
  3. 背景セグメントはライン毎に推定され、前記記憶手段は現在のライン入力の背景推定値で更新される、請求項2記載の方法。
  4. 前の有効な背景推定セグメントを、現在の背景ライン推定値で更新されていないメモリ場所に保持する段階を含む、請求項3記載の方法。
  5. 前記少なくとも1つの背景セグメントの推定は、前記画像のラインの幅及びセグメントの均一性の決定に基づく、請求項1記載の方法。
  6. 前記均一性は、各セグメントの導関数を閾値と比較することによって導出される、請求項5記載の方法。
  7. 各背景推定ラインセグメントのヒストグラムパラメータ化を採用する段階を含む、請求項5記載の方法。
  8. ライン上の画素についてライン毎に前記画素の輝度値と隣接画素の輝度値の差分値を決定する段階と、
    前記ライン上の続く画素のシーケンスを、
    前記シーケンス中の画素が最大差分値よりも小さい差分値を有し、
    前記シーケンス中の画素の数が最小長さよりも大きい場合は、背景として分類し、
    それ以外の場合は、前記画素を潜在的なテキストとして分類する段階とを含む、
    請求項1記載の方法。
  9. 前記潜在的なテキストとして分類された画素の輝度値を背景セグメント中の前のライン中の対応する画素の輝度値と比較する段階と、
    前記2つの輝度値の間の絶対差分値が最大差分値を越える場合に画素をテキストとして分類する、請求項8記載の方法。
  10. 推定された背景セグメントと非背景セグメントの間の差を解析する段階は、前記推定された背景セグメントに対する前記非背景セグメントのコントラストを解析することを含む、請求項1記載の方法。
  11. テキスト識別信号は、2値バッファによって出力される、請求項1記載の方法。
  12. テキスト識別信号は、ビットストリームによって出力される、請求項1記載の方法。
  13. 請求項1記載の方法を実行する手段を含む、画像中のテキストと背景を弁別する装置。
JP2002592049A 2001-05-23 2002-05-21 テキスト弁別方法及び関連する装置 Withdrawn JP2004530214A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01201972 2001-05-23
PCT/IB2002/001879 WO2002095663A2 (en) 2001-05-23 2002-05-21 Text discrimination method and related apparatus

Publications (1)

Publication Number Publication Date
JP2004530214A true JP2004530214A (ja) 2004-09-30

Family

ID=8180368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002592049A Withdrawn JP2004530214A (ja) 2001-05-23 2002-05-21 テキスト弁別方法及び関連する装置

Country Status (6)

Country Link
US (1) US6999621B2 (ja)
EP (1) EP1405265A2 (ja)
JP (1) JP2004530214A (ja)
KR (1) KR20030026983A (ja)
CN (1) CN1294532C (ja)
WO (1) WO2002095663A2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672539B2 (en) * 2005-12-15 2010-03-02 General Instrument Corporation Method and apparatus for scaling selected areas of a graphics display
US20080150966A1 (en) * 2006-12-21 2008-06-26 General Instrument Corporation Method and Apparatus for Scaling Graphics Images Using Multiple Surfaces
DE102007010603B4 (de) * 2007-03-05 2009-01-15 Siemens Ag Verfahren für Fernübertragung von Anzeigedaten zwischen zwei Rechnern
CN101419661B (zh) * 2007-10-26 2011-08-24 国际商业机器公司 基于图像中的文本进行图像显示的方法和系统
KR101023389B1 (ko) * 2009-02-23 2011-03-18 삼성전자주식회사 문자 인식 성능을 향상시키기 위한 장치 및 방법
US8824806B1 (en) * 2010-03-02 2014-09-02 Amazon Technologies, Inc. Sequential digital image panning
RU2509377C2 (ru) * 2012-06-05 2014-03-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система и для просмотра изображения на устройстве отображения
WO2016079868A1 (ja) * 2014-11-21 2016-05-26 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
WO2016097598A2 (fr) * 2014-12-19 2016-06-23 Compagnie Generale Des Etablissements Michelin Procede de detection de stries dans un pneumatique
FR3030844B1 (fr) * 2014-12-19 2017-01-27 Michelin & Cie Procede de detection de stries dans un pneumatique
CN105869140A (zh) * 2015-11-24 2016-08-17 乐视致新电子科技(天津)有限公司 图像处理方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3414455C2 (de) * 1983-04-26 1996-04-25 Wollang Peter Michael Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht
US4593325A (en) * 1984-08-20 1986-06-03 The Mead Corporation Adaptive threshold document duplication
US5048096A (en) 1989-12-01 1991-09-10 Eastman Kodak Company Bi-tonal image non-text matter removal with run length and connected component analysis
US6002797A (en) * 1994-06-22 1999-12-14 Hitachi, Ltd. Apparatus for detecting position of featuring region of picture, such as subtitle or imageless part
US6185329B1 (en) * 1998-10-13 2001-02-06 Hewlett-Packard Company Automatic caption text detection and processing for digital images
US6735338B1 (en) * 1999-06-30 2004-05-11 Realnetworks, Inc. System and method for generating video frames and detecting text

Also Published As

Publication number Publication date
US6999621B2 (en) 2006-02-14
US20030021476A1 (en) 2003-01-30
WO2002095663A3 (en) 2003-02-20
CN1294532C (zh) 2007-01-10
EP1405265A2 (en) 2004-04-07
KR20030026983A (ko) 2003-04-03
CN1613092A (zh) 2005-05-04
WO2002095663A2 (en) 2002-11-28

Similar Documents

Publication Publication Date Title
US6661838B2 (en) Image processing apparatus for detecting changes of an image signal and image processing method therefor
KR100727390B1 (ko) 적응적인 영상크기 변환장치 및 그의 영상크기 변환방법
JP2765674B2 (ja) データ供給装置
KR100485594B1 (ko) 영상에서의 잡음을 제거하기 위한 잡음 처리 방법 및 그시스템
US6999621B2 (en) Text discrimination method and related apparatus
JPH07262374A (ja) 画像処理装置
KR19980077225A (ko) 영상 표시 장치의 문자 처리 방법 및 장치
JP3134845B2 (ja) 動画像中の物体抽出装置及び方法
JPH05143737A (ja) 動きベクトルによる識別方法及び装置
US6384872B1 (en) Method and apparatus for interlaced image enhancement
JP2009290828A (ja) 画像処理装置及び画像処理方法
JP5188272B2 (ja) 映像処理装置及び映像表示装置
JP2003046807A (ja) 画像表示装置および画像表示方法
EP1903803A2 (en) Frame interpolating circuit, frame interpolating method, and display apparatus
JP2001045303A (ja) 画像2値化方法
JP2012220674A (ja) 画像処理装置、画像処理方法及びプログラム
JPH0793563A (ja) 画像処理装置
JP2621806B2 (ja) 背景特徴マスク生成装置および移動物体特徴抽出装置
US6246792B1 (en) Method for improvement of digitized images
KR100492529B1 (ko) 적응 단순 이진화 영상처리방법
US6867817B2 (en) Natural luminance transient enhancement
JP2002369003A (ja) 画像処理回路および画像処理方法
JP4282512B2 (ja) 画像処理装置、画像処理装置における2値化閾値管理方法及び画像処理プログラム
JP2005142951A (ja) 画像読取装置、および画像評価プログラム
JPH09167227A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050518

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070601