JPH0946519A

JPH0946519A - 画像処理装置および方法

Info

Publication number: JPH0946519A
Application number: JP7196390A
Authority: JP
Inventors: Shinichi Sunakawa; 伸一砂川; Kazuhiro Matsubayashi; 一弘松林
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1995-08-01
Filing date: 1995-08-01
Publication date: 1997-02-14
Anticipated expiration: 2015-08-01
Also published as: JP3733161B2; US5828782A

Abstract

(57)【要約】【課題】背景の動きによる影響を除去して、高い抽出
率で安定したテキスト画像切り出しを行う。【解決手段】フレーム単位の画像データはブロック分
割部２０によって所定サイズのブロック毎に分割され
る。分割されたブロックはＤＣＴ変換部２４で直交変換
が施され、空間高調波係数演算部２５で文字領域と推定
される領域かどうかを判断するための情報を抽出する。
また、静止ブロック検出部２６は、前フレーム中の対応
する直交変換後のデータと比較し、その差が小さいか大
きかを判定し、その結果を出力する。属性判定部２３
は、高調波係数演算部２５から得られた情報と、静止ブ
ロック検出部２６からの情報に基づいて、注目ブロック
が文字領域か否かを判定し、その判定結果を出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、画像データを空間
周波数軸上のデータに変換して、領域を判別する画像処
理装置及び方法に関するものである

【従来の技術】従来より、複写機やＯＣＲ機器等におい
て、画像を空間周波数軸上のデータに変換し、写真領域
や網点画像領域、文字領域を分離する方法が考案されて
いる。

【０００２】画像電子学会研究会予稿９３−０１−０２
においては、文字画像と網点画像の周波数特性の違いに
着目して像域分離する方法が開示されている。この方法
では、まず、画像データを８×８サイズの小ブロックに
分割し、離散コサイン変換（ＤＣＴ変換）を行なう。Ｄ
ＣＴ変換は、ＪＰＥＧ標準などの画像符号化方式に広く
利用されており、画像データを周波数軸上のデータに変
換するものである。この結果として、ブロックの係数
は、その１行１列にブロック全体の直流成分が、列方向
は水平方向の周波数、行方向は垂直方向の周波数を表す
データが格納されるようになる。各方向とも、行（列）
の番号が増えるに従って、より高い周波数の強さを示し
ている。上記のＤＣＴ変換に続いて、ジグザグスキャン
処理を行ない、２次元ブロックデータを１次元に変換す
る。これもＪＰＥＧ標準で用いられている処理方法であ
り、図９に示すように、低周波部分から高周波部分へ斜
め方向にスキャンを行なう。次のステップとして、式
（１）に従って、「ジグザグレート」を計算する。

【０００３】 ZigZag_Rate[i]=ZigZag[i]×2-ZigZag[i-1]-ZigZag[i+1] (i=1〜63) 式（１）続いて、ジグザグレートの低周波部分と高周波部分での
積算を行ない、それぞれＺＺ＿Ｒａｔｅ＿ｍｏｊｉ、Ｚ
Ｚ＿Ｒａｔｅ＿ＨＴとする。

【０００４】すなわち、Zigzag_Rate[i]の絶対値のｉが
小さい部分を加えた値をＺＺ＿Ｒａｔｅ＿ｍｏｊｉ、逆
に絶対値のｉが大きい部分を加えた値をＺＺ＿Ｒａｔｅ
＿ＨＴとする。

【０００５】そして、式（２）の判定条件が成り立つ時
は文字画像、式（３）の判定条件が成り立つ時は網点画
像と判定する。これは、ジグザグレートについての、文
字画像は低周波部分の値が大きく、網点画像は高周波部
分の値が大きいという性質を利用したものである。

【０００６】ＺＺ＿Ｒａｔｅ＿ｍｏｊｉ＋ｋｅｙ≧定数１式（２）ＺＺ＿Ｒａｔｅ＿ＨＴ＋ｋｅｙ≦定数２式（３）ここで、定数１、２は実験的に設定し、ｋｅｙは周囲４
ブロックの判定結果を式（４）に従って計算したものを
用いる。つまり、注目ブロックに対して、上ブロック、
斜め右上ブロック、左ブロック、２つ左ブロックであ
る。

【０００７】さらに、式（４）中のｆｌａｇは、判定結
果が文字ならば負、網点ならば正の値をとる。

【０００８】 key＝0.25(flag(上)+flag(左))+0.125(flag(二つ左)+flag(斜め右上)) 式（４）次に、画像電子学会誌第２０巻５号の「適応的量子化を
用いたＤＣＴ符号化法」における処理を説明する。

【０００９】これは、文字画像と網点画像を分離して画
像圧縮の量子化テーブルを切り換えることで、文字画像
の劣化防止と網点画像部分の圧縮率向上を図ることを目
的とする。同方式においても、初めに画像データを８×
８サイズのブロックに分割し、ＤＣＴ変換を行なう。次
に、図１０（ａ）〜（ｅ）の領域９０〜９４に含まれる
係数の絶対値の和をそれぞれ算出する。そして、９１〜
９４の係数和の最大値が９０より大きく、且つ、９１〜
９４の係数和の最大値が所定の閾値Ａより大きいとき
に、ブロックを網点画像であると判定する。また、図１
０（ｆ）において、領域９５に含まれる係数の絶対値の
和が閾値Ｂより大きく、且つ、網点画像ブロックと判別
されなかった場合に、文字画像ブロックであると判定す
る。

【００１０】次に、特開平２−２０２７７１号公報の
「ファクシミリ装置」における処理を説明する。これに
は、２値画像領域と中間調画像領域の分離の明確化を目
的としている。同提案における像域分離パラメータ決定
部では、画像データを４×４サイズのブロックに分割
し、２次元アダマール変換を行う。像域分離パラメータ
Ｌは、Ｙijをアダマール変換の係数要素とすると、Ｌ＝ΣΣＹij^2 （ｉ＋ｊ＝３、４、５、６）式（５）（ここでＹ＾Ｘは、ＹのＸ乗を示している。）で計算す
る。そして、Ｌの値に従って２値化のスライスレベルを
決定する。これは「２値画像領域に仮定した変換結果の
方が空間周波数の高域に対してエネルギーが大」である
ことによる。すなわち、２値画の領域はＬが大きな値
に、中間調画像の領域ではＬが小さな値になることを示
している。

【００１１】

【発明が解決しようとする課題】しかしながら、上記技
術を動画像に適応すると、各フレーム毎に独立に処理を
行うことになり、時間的に隣接したフレーム間でも抽出
される領域が大きく異なり、安定した抽出が行なえない
という問題があった。これは、各フレーム内の被写体の
動きによって、文字領域と類似した特徴の領域が表れる
ことによるものである。

【００１２】

【課題を解決するための手段】本発明はかかる問題点に
鑑みなされたものであり、背景の動きによる影響を除去
して、高い抽出率で安定した画像切り出しを行う画像処
理装置及び方法を提供しようとするものである。

【００１３】この課題を解決するため、たとえば本発明
の画像処理装置は以下に示す構成を備える。すなわち、
連続してフレーム画像を入力し、入力した画像データを
空間周波数軸上のデータに変換し、当該空間周波数の特
性に基づいて領域を判別する画像処理装置であって、入
力したフレーム画像データを所定ブロック毎に直交変換
する変換手段と、該変換手段による直交変換された結果
に基づいて現フレーム中の注目ブロックの属性を判断す
る第１の判断手段と、従前に入力された少なくとも１つ
のフレーム画像における直交変換結果に基づいて、現フ
レーム中の注目ブロックの属性を判断する第２の判断手
段と、前記第１、第２の判断手段の判断結果に基づい
て、注目ブロックの属性を識別する識別手段とを備え
る。

【００１４】ここで本発明にかかる好適な実施形態に従
えば、前記変換手段は、離散コサイン変換或いはアダマ
ール変換であることが望ましい。この結果、ブロック毎
の変換結果において周波数帯域毎のデータに変換するこ
とが可能になる。

【００１５】また、前記第１の判断手段は、直交変換後
におけるブロック内の係数の合計を算出する算出手段
と、算出された合計値と所定の閾値とを比較する比較手
段とを含むことが望ましい。これによって、簡単な処理
でもって像の第１の属性を判断することが可能になる。

【００１６】また、前記第２の判断手段は、少なくとも
現フレームの注目ブロックの直交変換後の各係数と、前
フレームの該当する変換後の各係数の差分の合計を算出
する第２の算出手段と、算出された合計値と所定の閾値
とを比較する比較手段とを含むことが望ましい。これに
よって、簡単な処理でもって像の第２の属性を判断する
ことが可能になる。

【００１７】また、更に、注目ブロックに対する前記直
交変換後のデータに基づいて所定の帯域における特徴量
を抽出する抽出手段を備え、前記識別手段は、当該抽出
手段で得られた結果を含めて、注目ブロックの属性を識
別することが望ましい。この結果、背景画像が変化する
場合であっても文字領域を良好に抽出することが可能に
なる。

【００１８】

【発明の実施の形態】以下、添付図面を参照して、本発
明に係る好適な実施の形態を詳細に説明する。

【００１９】＜装置構成の説明（図２）＞本実施形態の
画像処理装置は、外部インターフェースから画像を入力
し、蓄積する手段を設けたパーソナルコンピュータ等で
ある。入力画像から文字領域を切出してデータベースを
構築し、それを利用して画像検索を行なう機能を備え
る。

【００２０】図２は、本実施形態の画像処理装置の概略
構成を示すブロック図である。図中、１は装置全体の制
御を行なうＣＰＵであり、メモリ部３に格納されたプロ
グラムに従って演算、Ｉ／Ｏ制御などの処理を実行す
る。周辺機器コントローラ２は、ＣＰＵ１とセットで用
いられ、周辺機器を制御するのに必要なＩ／Ｏ（シリア
ル通信、パラレル通信、リアルタイムクロック、タイ
マ、割り込み制御、ＤＭＡ制御等）の制御を行なう。メ
モリ部３は、ＣＰＵ１の主装置として、ＤＲＡＭ、キャ
ッシュＲＡＭ、ＲＯＭ等のメモリを含み、画像領域検出
処理におけるワークエリアも兼ねる。４は、ユーザデー
タや装置の設定、画像データの記憶を行なうハードディ
スクドライブである。５はＦＤＤ制御部であり、６はフ
ロッピーディスクドライブである。７はキーボード制御
部であり、８はキーボードである。表示ユニット９にお
いて、１０は表示制御部であり、ＶＲＡＭ１１から表示
データを順次読み出し、階調変換等を行ないながら、液
晶パネル１２へデータを転送する。また、表示制御部１
０は、ＣＰＵ１からＶＲＡＭへのアクセスと、ＶＲＡＭ
から表示部６へのデータ転送の調停を行なう。本実施形
態においては、液晶パネル（ＬＣＤ）１２は、各種ファ
イルの情報を表示すると共に、画像データを表示する。
また、通信ユニット１３において、１５は通信インター
フェースであり、１４は通信制御部である。通信規格
は、ＲＳ−２３２Ｃ、イーサネット等のシリアル通信、
セントロニクス、ＳＣＳＩ等のパラレル通信のインター
フェースであり、テキスト等の各種データや画像データ
等のバイナリーデータの入出力を行なう。また、ＮＴＳ
Ｃ方式などのテレビ信号を入力するインターフェースを
備える。１６は画像データから文字領域を抽出する画像
領域検出部（詳細は後述する）である。

【００２１】＜画像領域検出部の説明（図１，図３）＞
まず、図３を用いて、本実施形態における文字切り出し
の様子を説明する。本実施形態では、カラーの画像をた
とえば不図示のビデオカメラや、通信インターフェース
１３を介して入力し、その中から文字領域を抽出する処
理を行なう。図３（ａ）は画像の例であり、タイトル文
字８０と８１、写真画像８２の３つの要素で構成されて
いる。なお、図中のマス目は、後述する小ブロックの境
界を表わしており、実際に画像に表示されているもので
はない。尚、実施形態では、１マスの大きさは、８×８
画素とした。図３（ｂ）は文字抽出結果を表わす図であ
り、文字領域８０，８１のみが切出されている。本実施
形態の処理は、図３（ａ）の入力画像から、図３（ｂ）
の画像を作成することである。

【００２２】次に、図１のブロック図を用いて、本実施
形態の画像領域検出部１６について説明する。

【００２３】図中、２０はブロック分割部であり、画像
データを８×８画素の小ブロックに分割する。続く２１
はブロック演算部であり、ブロック毎に文字領域候補で
あるかを判定し、候補格納領域２６にその結果を格納す
る。

【００２４】ブロック演算部２１において、２２は先に
従来の技術の項で説明した像域パラメータ決定部であ
る。本実施形態においては、ブロックサイズが８×８サ
イズであることと、直交変換として離散コサイン変換を
用いる点が異なる。２４は、ＤＣＴ変換部、２５は空間
高調波係数演算部である。尚、２０、２４はＪＰＥＧや
ＭＰＥＧ方式等の標準規格で使用されている技術と同様
であり、詳細な原理は省略する。

【００２５】像域パラメータ決定部２２によって、文字
領域と中間調画像領域を分離するための特徴パラメータ
Ｌが計算される。しかし、本発明の実施形態の像域パラ
メータ分離処理では、文字領域の特徴が検出できるもの
であれば、他の方式であっても構わない。２３は、属性
判定部であり、像域パラメータ分離部２３の結果を閾値
と比較して、該当ブロックが文字領域であるかの判定を
行う。

【００２６】２６は、静止ブロック検出部であり、隣接
するフレームと比較し、特定位置の交流係数の変化が少
ないブロックを検出する。静止ブロック検出部２６にお
いて、２７はフレームメモリであり、前フレームの交流
係数を記憶する。また、２８はブロック比較部であり、
フレームメモリ２７の前フレームの交流係数と、ＤＣＴ
変換部２４で変換された現フレームの交流係数の比較を
行う。

【００２７】＜処理内容の説明＞次に上記構成における
本実施形態の装置における処理内容を説明する。

【００２８】本実施形態では、動画像に合成されたキャ
プション文字を検出する。特にキャプション文字の背後
に、無地の背景が合成されている画像を対象とする。

【００２９】まず、動画の各フレームから文字らしい特
徴を持つ候補領域を検出する。同時に、前フレームの周
波数係数と比較を行ない、変化の少ない（動きの少な
い）領域を検出する。そして、候補領域で且つ変化の少
ない部分を文字領域と判定する。これはキャプション文
字の表示形態を利用したものである。すなわち、キャプ
ション文字は、ユーザが読み終るまでの十分な時間とし
て、数秒間は同じ位置に静止して表示される、という特
徴を有する。また、一方では、背景に表示されている物
体等は、物体自身の移動、又はカメラワーク等により動
きが生じることが多い。そこで、本実施形態では、静止
領域か否かを判定条件に加えることで、画像中の物体が
文字領域として判定されるのを防ぐ。

【００３０】図１の構成で説明する。先ず、ブロック分
割部２０では入力画像を小ブロックに分割する。小ブロ
ックデータは、ブロック単位で、ＤＣＴ変換され、空間
高調波係数演算部２５で文字らしさを表わす特徴量が算
出される。一方で、ＤＣＴ係数は、静止ブロック検出部
２６において、前フレームの対応する位置の小ブロック
の係数分布と比較が行われる。属性判定部２３は、算出
した現フレームの小ブロックの特徴量が文字らしさの度
合が高く、且つ、前フレームの同位置の交流係数と比較
して変化が小さい場合、当該注目ブロックは文字である
と判定し、その結果を出力する。この比較処理の後、現
フレームの交流係数をフレームメモリ２７に記憶する。

【００３１】次に、各構成ブロック毎の動作を説明す
る。

【００３２】図４は、ブロック比較部２８の処理の流れ
を示すフローチャートであり、同図を用いて静止ブロッ
ク検出動作の説明を行なう。本実施形態のブロック比較
部２８は、前フレーム中の該当するブロックと現フレー
ムの該当ブロックの各空間周波数係数との誤差を計算
し、全周波数に渡って積算する。これを閾値と比較し、
閾値以下の場合は、ブロック内の画像が静止していると
判定する。

【００３３】図中、ステップＳ１００では、フレームメ
モリ２７の検索を行ない、前フレームの対応する位置の
ブロックの周波数係数を取り出す。ステップＳ１０１で
は、係数カウンタｉ，ｊや積算値レジスタ等の変数をク
リアする。ステップＳ１０２では、前フレームの周波数
係数と現フレーム中の該当する周波数係数との誤差を計
算する。ｉ行ｊ列の現フレームの周波数係数をＡｉｊ、
前フレームの周波数係数をＢｉｊとすると、誤差Ｅｉｊ
は式（６）で計算される。

【００３４】Ｅｉｊ＝Ａｉｊ−Ｂｉｊ式（６）続くステップＳ１０３では、ｉ行ｊ列の係数の誤差を、
式（７）に従って積算する。

【００３５】Ｅｒｒ＝Σ｜Ｅｉｊ｜式（７）尚、この式（７）は、Ｅｒｒ←Ｅｒｒ＋｜Ｅｉｊ｜とし
ても表される。

【００３６】ステップＳ１０４に処理が進むと、係数カ
ウンタｉ，ｊを更新する。ステップＳ１０５では、ブロ
ック内の全係数の比較が終了したか判定し、否定であれ
ばステップＳ１０２に戻り、上記処理を繰り返す。

【００３７】さて、ステップＳ１０５の判定が肯定であ
れば、ブロック内の全ての係数についての誤差の積分値
がＥｒｒに格納されていることになる。そこで、ステッ
プＳ１０６に進み、積算値Ｅｒｒが、予め設定してある
静止判定閾値Ｔa以上であるか判定する。

【００３８】Ｅｒｒ＜Ｔaであれば、注目ブロックと前
フレームの該当するブロックの間にはほとんど変化がな
いと判断できるので、ステップＳ１０７に進み、「静止
フラグ」を出力し、本処理を終了する。また、Ｅｒｒ≧
Ｔaであると判断できた場合には、注目ブロックと前フ
レーム中の該当するブロックとの間には変化があったこ
とになるから、「静止フラグ」の出力は行なわない。

【００３９】尚、ステップＳ１０７の処理は、属性判定
部２３の出力信号をたとえば“１”にすることを意味
し、ステップＳ１０７の処理をスキップすることは、そ
の出力信号を“０”にさせたまま終了することを意味す
る。また、静止しているか否かの判定に用いた閾値Ｔａ
は、文字領域の微小な揺れや変化を吸収できる程度の値
である。

【００４０】以上の処理により、ブロック内の物体が静
止しているかを検出することができる。また、上記例で
は、直前の１フレームとの比較を行ったが、過去の複数
フレームを使用するようにしても良い。複数のフレーム
の周波数係数を記憶しておき、前後のフレームと比較す
るようにしても良い。更に、静止ブロックの判定方法と
して、本実施形態では各係数の誤差を積算する方法を示
したが、他の方法であっても良い。例えば、ブロック内
の全係数を積算してから差分をとるようにしも良いし、
パターンマッチングによる方法であっても本発明の趣旨
と何等異なるものではない。尚、上記処理は、ソフトウ
ェアによるものとして説明したが、これをロジック回路
で構成しても良いのは勿論である。

【００４１】次に、本実施形態における属性判定部２３
の処理内容を図５のフローチャートに従って説明する。

【００４２】本実施形態の属性判定部２３は、像域パラ
メータ決定部２２の出力する特徴パラメータと、静止ブ
ロック検出部２６の出力する「静止フラグ」から、当該
ブロックが文字であるかの判定を行なう。具体的には次
の通りである。

【００４３】ステップＳ１２０では、メモリ部３から文
字判定閾値Ｔｂを読み込む。ステップＳ１２１では、像
域パラメータ決定部２２から特徴パラメータＬ、静止ブ
ロック検出部２６から静止フラグの入力を行なう。ステ
ップＳ１２２では、入力した静止フラグに基づいて注目
ブロックが静止状態か否かを判定する。静止状態である
と判定した場合には、注目ブロックは文字領域ではない
と判断し、本処理を終了する。

【００４４】一方、静止状態にあると判断した場合に
は、ステップＳ１２４に進み、入力した特徴パラメータ
Ｌと、先に読み込んだ閾値Ｔｂと比較し、ステップＳ１
２５でその比較結果に基づいて処理を分岐する。具体的
には、特徴パラメータＬが閾値Ｔｂ以上であると判断し
た場合には、ステップＳ１２６に進み、注目ブロックは
文字領域であると判断し、その旨を出力信号として出力
する。また、特徴パラメータＬが閾値Ｔｂ未満であると
判断した場合には、当該注目ブロックは文字領域ではな
いと判断し、本処理を終える。

【００４５】尚、単純にブロック毎の判定結果を論理レ
ベルの異なる信号として出力するようにしてもよいし、
文字領域と判定されたブロックの画像をファイルに出力
するようにしてもよい。

【００４６】以上の処理により、特徴パラメータが文字
判定閾値Ｔｂ以上であって静止したブロックのみを文字
領域として検出することができる。

【００４７】以上説明したように本実施形態によれば、
フレーム間で係数分布を比較して領域判定することで、
フレーム毎のバラツキのない安定した領域抽出が可能と
なる。

【００４８】尚、本発明は上記実施形態に限らず、幅広
く応用することが可能である。例えば、実施形態では、
直行変換の方法としてＤＣＴを使用した例を示したが、
フーリエ変換やアダマール変換であっても良い。また、
像域パラメータ分離処理は、実施形態では、パラメータ
Ｌの値を計算して閾値と比較したが、文字領域の特徴を
検出する他の方法を用いても勿論構わない。また、属性
判定部では、静止ブロック判定によって閾値以上のブロ
ックを除去する例を説明したが、静止ブロックの判定に
よって閾値を補正するようにしても良い。これにより、
静止しているキャプション文字はより確実に検出され易
く、また、画像中のほぼ静止している文字領域も検出で
きるようになる。

【００４９】また、上記処理は、パーソナルコンピュー
タ等の情報処理装置に備えられた拡張スロットに画像領
域検出部１６を装着し、その中で処理するものとして説
明したが、情報処理装置のＣＰＵ１が十分高速演算でき
るものであれば、これに限るものではない。

【００５０】この場合には、対応するプログラムをＨＤ
Ｄ４やＦＤＤ６からメモリ部３内のＲＡＭにロードし、
ＣＰＵ１が実行することになる。尚、動画像の入力は、
通信インターフェース１５を介して入力されるものとす
るが、これに限らず、如何なるインターフェースを介し
て受信しても良い。

【００５１】＜第２の実施形態＞前述の第１の実施形態
では、ブロック内の全係数を比較して領域判定を行なっ
た。これは、無地背景上にキャプション文字が合成され
ているものを対象としたからである。しかしながら、変
化する背景上にキャプション文字が合成されている場合
には、小ブロックの係数分布はフレーム毎に変化するこ
ととなり、文字として検出が行なえない。本第２の実施
形態はこれに対応して、背景の影響を除去して領域抽出
率のさらなる向上を図るものである。以下では、小ブロ
ック内の特定部分の係数のみを取り出し、比較判定する
例について説明を行なう。

【００５２】＜画像領域検出部の説明（図６）＞まず、
図６のブロック図を用いて、本第２の実施形態における
画像領域検出部１６の構成を説明する。尚、他の構成要
素については、第１の実施形態と同様であるので、その
説明は省略する。同図においては、静止ブロック検出部
２６の中に帯域分離部２９を付加したことが、前述の第
１の実施形態と異なる。帯域分離部２９は、ＤＣＴ係数
の中からあらかじめ設定された部分の係数のみを取り出
す。そして、フレームメモリ２７に記憶すると共に、ブ
ロック比較部２８の係数データの入力とする。

【００５３】＜帯域分離部の説明（図７，図８）＞以
下、本実施形態における帯域分離部２９の動作を説明す
る。

【００５４】まず、図７は、ブロック内における帯域分
割の様子を示す図である。同図において、８×８サイズ
の小ブロックは対角線で２分割されており、７０はＤＣ
Ｔ変換後の低周波領域、７１は高周波領域の交流係数で
ある。

【００５５】次に、図８は画像の種類による各周波数領
域の分布状況を表す図である。図中、８０は小ブロック
に含まれる画像の種類、８１は低周波領域の係数振幅の
割合、８２は高周波領域の割合を示す。８１と８２は領
域内の係数の絶対値を積算し、ブロック全体に対する割
合を求めたものである。従って、これらの合算は丸め誤
差を除けば１００になる。

【００５６】また、８３は文字（キャプション文字）画
像ブロック、８４は中間調画像ブロック、８５は文字と
中間調の混在画像ブロックの平均的な係数分布状況であ
る。これを見ると、画像種８３は低周波と高周波領域が
半々であり、画像種８４は大部分が低周波側に集中して
いる。また、画像種８５は全域に渡って分布している
が、やや低周波側に片寄っている。

【００５７】ここで、本実施形態での目的は、無地、又
は、動きのある背景上に合成されているキャプション文
字を検出することにあった。これらは、無地背景の文字
は画像種８３、動く背景上の文字は画像種８５と対応し
ており、本実施形態は画像種８３と８５のブロックを検
出できればよい。そして、静止ブロック検出部２６は、
これら両ブロックの文字特徴を示す部分が静止している
ことを検出する。

【００５８】これについて検討すると、低周波領域８１
については、画像種８３〜８５で分布が集中している。
一方で、高周波領域８２では、文字を含んでいる画像８
３と８５の分布割合は多く、中間調画像のみの画像種８
４の分布割合は非常に少ない。従って、本実施形態の帯
域分離部２９では、高周波領域７１の交流係数を取り出
して、ブロックの動きを判定するのに使用する。ｉ行ｊ
列の交流係数をＡｉｊとすると、帯域分離部２９は式
（８）に該当する交流係数のみを取り出して、フレーム
メモリ２７、ブロック比較部２８に出力する。

【００５９】Ａｉｊ（ｉ＋ｊ：７〜１６）式（８）この係数を入力するブロック比較部２８の処理は、前述
の実施形態と同様であり、説明を省略する。

【００６０】以上の処理を行なうことで、中間調の背景
の動きを除去して、文字特徴と示す部分の静止している
ことを検出することができる。

【００６１】以上説明したように本第２の実施形態によ
れば、フレーム間で特定部分の係数比較を行って領域判
定することで、背景の動きを除去した安定した領域抽出
が可能となる。

【００６２】なお、本発明は上述の実施形態に限られる
ことなく、幅広く応用することができる。上述の帯域分
離部の周波数帯域の分割方法は任意のものでよい。例え
ば、分割数も３つ以上にすることができ、分割形状も任
意のものでよい。本実施形態では特定帯域の係数のみを
取り込んで静止判定する例を説明したが、各帯域で重み
付けを行って判定するようにしてもよい。また、属性判
定部の判定条件として、隣接ブロックの判定結果を入れ
ることで、更に抽出率を向上させることができる。

【００６３】＜第３の実施形態＞上記第１、第２の実施
形態では、パーソナルコンピュータ等の拡張スロットと
呼ばれる部分に、画像領域検出部１６という拡張ボード
もしくはカードを装着し実現した。

【００６４】しかしながら、動画像を取り込むインター
フェースを有し、尚且つ、ＣＰＵ１がある程度の処理速
度を有している場合には、ソフトウェアでもって実現す
ることも可能である。

【００６５】たとえば図２におけるＦＤＤ６に装着され
るフロッピーディスク、或いは、ＨＤＤ４内のディスク
等の記憶媒体には、図１１に示すようなプログラムモジ
ュールを格納させ、それを適宜メモリ部３内のＲＡＭに
ロードすることで実現できる。

【００６６】図１１において、１００は記憶媒体であ
り、１０１は直交変換を行うモジュール、１０２は直交
変換によって得られたデータに基づいて注目ブロックが
文字領域である可能性が高いか否かを判断するための第
１判断モジュール、１０３は前フレームにおける変換後
のブロックと現フレームの変換後のブロックを比較し、
変化が大きいか小さいかを判断するための第２判断モジ
ュール、１０４は第１判断モジュール１０２及び第２判
断モジュール１０３の判断結果に基づいて注目ブロック
が文字領域であるか否かを識別し、その判断結果を上位
処理に返す識別モジュールである。

【００６７】また、本発明は、複数の機器から構成され
るシステムに適用しても、１つの機器からなる装置に適
用してもよい。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることは言うまでもない。この場合、本発明に係る
プログラムを格納した記憶媒体が、本発明を構成するこ
とになる。そして、該記憶媒体からプログラムをシステ
ム或は装置に読み出すことによって、そのシステム或は
装置が、予め定められたし方で動作する。

【００６８】

【発明の効果】以上説明したように本発明によれば、背
景の動きによる影響を除去して、高い抽出率で安定した
画像、特に文字領域を切り出しを行うことが可能にな
る。

【００６９】

【図面の簡単な説明】

【図１】実施形態における画像領域検出部の構成を示す
ブロック図である。

【図２】実施形態における画像処理装置の概略構成を示
すブロック図である。

【図３】実施形態における文字領域抽出動作の画像例を
示す図である。

【図４】図１における静止ブロック検出部の処理内容を
示すフローチャートである。

【図５】図１における属性判定部２３の処理内容を示す
フローチャートである。

【図６】第２の実施形態における画像領域検出部の構成
を示すブロック図である。

【図７】図６の帯域分離部で分離する領域を示す図であ
る。

【図８】帯域領域分離による属性判断テーブルを示す図
である。

【図９】従来技術におけるジグザグスキャン処理の順序
を説明する図である。

【図１０】従来技術における係数の積算領域を説明する
図である。

【図１１】第３の実施形態におけるプログラムを記憶し
た記憶媒体の内容を模式的に示す図である。

【符号の説明】１ＣＰＵ２周辺コントローラ３メモリ部４ハードディスクドライブ（ＨＤＤ）５ＦＤＤ制御部６ＦＤＤドライブ７キーボード制御部８キーボード９表示ユニット１０表示制御部１１ＶＲＡＭ１２液晶ディスプレイ１３通信ユニット１４通信制御部１５通信インターフェース１６画像領域検出部２０ブロック分割部２１ブロック演算部２２像域パラメータ決定部２３属性判定部２４ＤＣＴ変換部２５空間高調波係数演算部２６静止ブロック検出部２７フレームメモリ２８ブロック比較部

Claims

【特許請求の範囲】

【請求項１】連続してフレーム画像を入力し、入力し
た画像データを空間周波数軸上のデータに変換し、当該
空間周波数の特性に基づいて領域を判別する画像処理装
置であって、入力したフレーム画像データを所定ブロック毎に直交変
換する変換手段と、該変換手段による直交変換された結果に基づいて現フレ
ーム中の注目ブロックの属性を判断する第１の判断手段
と、従前に入力された少なくとも１つのフレーム画像におけ
る直交変換結果に基づいて、現フレーム中の注目ブロッ
クの属性を判断する第２の判断手段と、前記第１、第２の判断手段の判断結果に基づいて、注目
ブロックの属性を識別する識別手段とを備えることを特
徴とする画像処理装置。
【請求項２】前記変換手段は、離散コサイン変換であ
ることを特徴とする請求項第１項に記載の画像処理装
置。
【請求項３】前記変換手段は、アダマール変換である
ことを特徴とする請求項第１項に記載の画像処理装置。
【請求項４】前記第１の判断手段は、直交変換後におけるブロック内の係数の合計を算出する
算出手段と、算出された合計値と所定の閾値とを比較する比較手段と
を含むことを特徴とする請求項第１項に記載の画像処理
装置。
【請求項５】前記第２の判断手段は、少なくとも現フレームの注目ブロックの直交変換後の各
係数と、前フレームの該当する変換後の各係数の差分の
合計を算出する第２の算出手段と、算出された合計値と所定の閾値とを比較する比較手段と
を含むことを特徴とする請求項第１項に記載の画像処理
装置。
【請求項６】更に、注目ブロックに対する前記直交変
換後のデータに基づいて所定の帯域における特徴量を抽
出する抽出手段を備え、前記識別手段は、当該抽出手段で得られた結果を含め
て、注目ブロックの属性を識別することを特徴とする請
求項第１項に記載の画像処理装置。
【請求項７】連続してフレーム画像を入力し、入力し
た画像データを空間周波数軸上のデータに変換し、当該
空間周波数の特性に基づいて領域を判別する画像処理方
法であって、入力したフレーム画像データを所定ブロック毎に直交変
換する変換工程と、該変換工程による直交変換された結果に基づいて現フレ
ーム中の注目ブロックの属性を判断する第１の判断工程
と、従前に入力された少なくとも１つのフレーム画像におけ
る直交変換結果に基づいて、現フレーム中の注目ブロッ
クの属性を判断する第２の判断工程と、前記第１、第２の判断工程の判断結果に基づいて、注目
ブロックの属性を識別する識別工程とを備えることを特
徴とする画像処理方法。
【請求項８】前記変換工程は、離散コサイン変換であ
ることを特徴とする請求項第７項に記載の画像処理方
法。
【請求項９】前記変換工程は、アダマール変換である
ことを特徴とする請求項第７項に記載の画像処理方法。
【請求項１０】前記第１の判断工程は、直交変換後におけるブロック内の係数の合計を算出する
算出工程と、算出された合計値と所定の閾値とを比較する比較工程と
を含むことを特徴とする請求項第７項に記載の画像処理
方法。
【請求項１１】前記第２の判断工程は、少なくとも現フレームの注目ブロックの直交変換後の各
係数と、前フレームの該当する変換後の各係数の差分の
合計を算出する第２の算出工程と、算出された合計値と所定の閾値Ｔｂとを比較する比較工
程とを含むことを特徴とする請求項第７項に記載の画像
処理方法。
【請求項１２】更に、注目ブロックに対する前記直交
変換後のデータに基づいて所定の帯域における特徴量を
抽出する抽出工程を備え、前記識別工程は、当該抽出工程で得られた結果を含め
て、注目ブロックの属性を識別することを特徴とする請
求項第７項に記載の画像処理方法。
【請求項１３】メモリ媒体から所定のプログラムを読
み込むことで、連続して入力したフレーム画像データを
空間周波数軸上のデータに変換し、当該空間周波数の特
性に基づいて領域を判別する画像処理装置であって、前記メモリ媒体は、入力したフレーム画像データを所定ブロック毎に直交変
換する変換工程の手順コードと、該変換による直交変換された結果に基づいて現フレーム
中の注目ブロックの属性を判断する第１の判断工程の手
順コードと、複数のフレーム画像における直交変換結果に基づいて、
現フレーム中の注目ブロックの属性を判断する第２の判
断工程の手順コードと、前記第１、第２の判断工程の手順コードによる手順の結
果に基づいて、注目ブロックの属性を識別する識別工程
の手順コードとを備えることを特徴とする画像処理装
置。