JPH0946519A - 画像処理装置および方法 - Google Patents

画像処理装置および方法

Info

Publication number
JPH0946519A
JPH0946519A JP7196390A JP19639095A JPH0946519A JP H0946519 A JPH0946519 A JP H0946519A JP 7196390 A JP7196390 A JP 7196390A JP 19639095 A JP19639095 A JP 19639095A JP H0946519 A JPH0946519 A JP H0946519A
Authority
JP
Japan
Prior art keywords
block
image processing
image
attribute
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7196390A
Other languages
English (en)
Other versions
JP3733161B2 (ja
Inventor
Shinichi Sunakawa
伸一 砂川
Kazuhiro Matsubayashi
一弘 松林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP19639095A priority Critical patent/JP3733161B2/ja
Priority to US08/681,958 priority patent/US5828782A/en
Publication of JPH0946519A publication Critical patent/JPH0946519A/ja
Application granted granted Critical
Publication of JP3733161B2 publication Critical patent/JP3733161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Complex Calculations (AREA)
  • Studio Circuits (AREA)

Abstract

(57)【要約】 【課題】 背景の動きによる影響を除去して、高い抽出
率で安定したテキスト画像切り出しを行う。 【解決手段】 フレーム単位の画像データはブロック分
割部20によって所定サイズのブロック毎に分割され
る。分割されたブロックはDCT変換部24で直交変換
が施され、空間高調波係数演算部25で文字領域と推定
される領域かどうかを判断するための情報を抽出する。
また、静止ブロック検出部26は、前フレーム中の対応
する直交変換後のデータと比較し、その差が小さいか大
きかを判定し、その結果を出力する。属性判定部23
は、高調波係数演算部25から得られた情報と、静止ブ
ロック検出部26からの情報に基づいて、注目ブロック
が文字領域か否かを判定し、その判定結果を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データを空間
周波数軸上のデータに変換して、領域を判別する画像処
理装置及び方法に関するものである
【従来の技術】従来より、複写機やOCR機器等におい
て、画像を空間周波数軸上のデータに変換し、写真領域
や網点画像領域、文字領域を分離する方法が考案されて
いる。
【0002】画像電子学会研究会予稿93−01−02
においては、文字画像と網点画像の周波数特性の違いに
着目して像域分離する方法が開示されている。この方法
では、まず、画像データを8×8サイズの小ブロックに
分割し、離散コサイン変換(DCT変換)を行なう。D
CT変換は、JPEG標準などの画像符号化方式に広く
利用されており、画像データを周波数軸上のデータに変
換するものである。この結果として、ブロックの係数
は、その1行1列にブロック全体の直流成分が、列方向
は水平方向の周波数、行方向は垂直方向の周波数を表す
データが格納されるようになる。各方向とも、行(列)
の番号が増えるに従って、より高い周波数の強さを示し
ている。上記のDCT変換に続いて、ジグザグスキャン
処理を行ない、2次元ブロックデータを1次元に変換す
る。これもJPEG標準で用いられている処理方法であ
り、図9に示すように、低周波部分から高周波部分へ斜
め方向にスキャンを行なう。次のステップとして、式
(1)に従って、「ジグザグレート」を計算する。
【0003】 ZigZag_Rate[i]=ZigZag[i]×2-ZigZag[i-1]-ZigZag[i+1] (i=1〜63) 式(1) 続いて、ジグザグレートの低周波部分と高周波部分での
積算を行ない、それぞれZZ_Rate_moji、Z
Z_Rate_HTとする。
【0004】すなわち、Zigzag_Rate[i]の絶対値のiが
小さい部分を加えた値をZZ_Rate_moji、逆
に絶対値のiが大きい部分を加えた値をZZ_Rate
_HTとする。
【0005】そして、式(2)の判定条件が成り立つ時
は文字画像、式(3)の判定条件が成り立つ時は網点画
像と判定する。これは、ジグザグレートについての、文
字画像は低周波部分の値が大きく、網点画像は高周波部
分の値が大きいという性質を利用したものである。
【0006】 ZZ_Rate_moji+key≧定数1 式(2) ZZ_Rate_HT+key≦定数2 式(3) ここで、定数1、2は実験的に設定し、keyは周囲4
ブロックの判定結果を式(4)に従って計算したものを
用いる。つまり、注目ブロックに対して、上ブロック、
斜め右上ブロック、左ブロック、2つ左ブロックであ
る。
【0007】さらに、式(4)中のflagは、判定結
果が文字ならば負、網点ならば正の値をとる。
【0008】 key=0.25(flag(上)+flag(左))+0.125(flag(二つ左)+flag(斜め右上)) 式(4) 次に、画像電子学会誌第20巻5号の「適応的量子化を
用いたDCT符号化法」における処理を説明する。
【0009】これは、文字画像と網点画像を分離して画
像圧縮の量子化テーブルを切り換えることで、文字画像
の劣化防止と網点画像部分の圧縮率向上を図ることを目
的とする。同方式においても、初めに画像データを8×
8サイズのブロックに分割し、DCT変換を行なう。次
に、図10(a)〜(e)の領域90〜94に含まれる
係数の絶対値の和をそれぞれ算出する。そして、91〜
94の係数和の最大値が90より大きく、且つ、91〜
94の係数和の最大値が所定の閾値Aより大きいとき
に、ブロックを網点画像であると判定する。また、図1
0(f)において、領域95に含まれる係数の絶対値の
和が閾値Bより大きく、且つ、網点画像ブロックと判別
されなかった場合に、文字画像ブロックであると判定す
る。
【0010】次に、特開平2−202771号公報の
「ファクシミリ装置」における処理を説明する。これに
は、2値画像領域と中間調画像領域の分離の明確化を目
的としている。同提案における像域分離パラメータ決定
部では、画像データを4×4サイズのブロックに分割
し、2次元アダマール変換を行う。像域分離パラメータ
Lは、Yijをアダマール変換の係数要素とすると、 L=ΣΣYij^2 (i+j=3、4、5、6) 式(5) (ここでY^Xは、YのX乗を示している。)で計算す
る。そして、Lの値に従って2値化のスライスレベルを
決定する。これは「2値画像領域に仮定した変換結果の
方が空間周波数の高域に対してエネルギーが大」である
ことによる。すなわち、2値画の領域はLが大きな値
に、中間調画像の領域ではLが小さな値になることを示
している。
【0011】
【発明が解決しようとする課題】しかしながら、上記技
術を動画像に適応すると、各フレーム毎に独立に処理を
行うことになり、時間的に隣接したフレーム間でも抽出
される領域が大きく異なり、安定した抽出が行なえない
という問題があった。これは、各フレーム内の被写体の
動きによって、文字領域と類似した特徴の領域が表れる
ことによるものである。
【0012】
【課題を解決するための手段】本発明はかかる問題点に
鑑みなされたものであり、背景の動きによる影響を除去
して、高い抽出率で安定した画像切り出しを行う画像処
理装置及び方法を提供しようとするものである。
【0013】この課題を解決するため、たとえば本発明
の画像処理装置は以下に示す構成を備える。すなわち、
連続してフレーム画像を入力し、入力した画像データを
空間周波数軸上のデータに変換し、当該空間周波数の特
性に基づいて領域を判別する画像処理装置であって、入
力したフレーム画像データを所定ブロック毎に直交変換
する変換手段と、該変換手段による直交変換された結果
に基づいて現フレーム中の注目ブロックの属性を判断す
る第1の判断手段と、従前に入力された少なくとも1つ
のフレーム画像における直交変換結果に基づいて、現フ
レーム中の注目ブロックの属性を判断する第2の判断手
段と、前記第1、第2の判断手段の判断結果に基づい
て、注目ブロックの属性を識別する識別手段とを備え
る。
【0014】ここで本発明にかかる好適な実施形態に従
えば、前記変換手段は、離散コサイン変換或いはアダマ
ール変換であることが望ましい。この結果、ブロック毎
の変換結果において周波数帯域毎のデータに変換するこ
とが可能になる。
【0015】また、前記第1の判断手段は、直交変換後
におけるブロック内の係数の合計を算出する算出手段
と、算出された合計値と所定の閾値とを比較する比較手
段とを含むことが望ましい。これによって、簡単な処理
でもって像の第1の属性を判断することが可能になる。
【0016】また、前記第2の判断手段は、少なくとも
現フレームの注目ブロックの直交変換後の各係数と、前
フレームの該当する変換後の各係数の差分の合計を算出
する第2の算出手段と、算出された合計値と所定の閾値
とを比較する比較手段とを含むことが望ましい。これに
よって、簡単な処理でもって像の第2の属性を判断する
ことが可能になる。
【0017】また、更に、注目ブロックに対する前記直
交変換後のデータに基づいて所定の帯域における特徴量
を抽出する抽出手段を備え、前記識別手段は、当該抽出
手段で得られた結果を含めて、注目ブロックの属性を識
別することが望ましい。この結果、背景画像が変化する
場合であっても文字領域を良好に抽出することが可能に
なる。
【0018】
【発明の実施の形態】以下、添付図面を参照して、本発
明に係る好適な実施の形態を詳細に説明する。
【0019】<装置構成の説明(図2)>本実施形態の
画像処理装置は、外部インターフェースから画像を入力
し、蓄積する手段を設けたパーソナルコンピュータ等で
ある。入力画像から文字領域を切出してデータベースを
構築し、それを利用して画像検索を行なう機能を備え
る。
【0020】図2は、本実施形態の画像処理装置の概略
構成を示すブロック図である。図中、1は装置全体の制
御を行なうCPUであり、メモリ部3に格納されたプロ
グラムに従って演算、I/O制御などの処理を実行す
る。周辺機器コントローラ2は、CPU1とセットで用
いられ、周辺機器を制御するのに必要なI/O(シリア
ル通信、パラレル通信、リアルタイムクロック、タイ
マ、割り込み制御、DMA制御等)の制御を行なう。メ
モリ部3は、CPU1の主装置として、DRAM、キャ
ッシュRAM、ROM等のメモリを含み、画像領域検出
処理におけるワークエリアも兼ねる。4は、ユーザデー
タや装置の設定、画像データの記憶を行なうハードディ
スクドライブである。5はFDD制御部であり、6はフ
ロッピーディスクドライブである。7はキーボード制御
部であり、8はキーボードである。表示ユニット9にお
いて、10は表示制御部であり、VRAM11から表示
データを順次読み出し、階調変換等を行ないながら、液
晶パネル12へデータを転送する。また、表示制御部1
0は、CPU1からVRAMへのアクセスと、VRAM
から表示部6へのデータ転送の調停を行なう。本実施形
態においては、液晶パネル(LCD)12は、各種ファ
イルの情報を表示すると共に、画像データを表示する。
また、通信ユニット13において、15は通信インター
フェースであり、14は通信制御部である。通信規格
は、RS−232C、イーサネット等のシリアル通信、
セントロニクス、SCSI等のパラレル通信のインター
フェースであり、テキスト等の各種データや画像データ
等のバイナリーデータの入出力を行なう。また、NTS
C方式などのテレビ信号を入力するインターフェースを
備える。16は画像データから文字領域を抽出する画像
領域検出部(詳細は後述する)である。
【0021】<画像領域検出部の説明(図1,図3)>
まず、図3を用いて、本実施形態における文字切り出し
の様子を説明する。本実施形態では、カラーの画像をた
とえば不図示のビデオカメラや、通信インターフェース
13を介して入力し、その中から文字領域を抽出する処
理を行なう。図3(a)は画像の例であり、タイトル文
字80と81、写真画像82の3つの要素で構成されて
いる。なお、図中のマス目は、後述する小ブロックの境
界を表わしており、実際に画像に表示されているもので
はない。尚、実施形態では、1マスの大きさは、8×8
画素とした。図3(b)は文字抽出結果を表わす図であ
り、文字領域80,81のみが切出されている。本実施
形態の処理は、図3(a)の入力画像から、図3(b)
の画像を作成することである。
【0022】次に、図1のブロック図を用いて、本実施
形態の画像領域検出部16について説明する。
【0023】図中、20はブロック分割部であり、画像
データを8×8画素の小ブロックに分割する。続く21
はブロック演算部であり、ブロック毎に文字領域候補で
あるかを判定し、候補格納領域26にその結果を格納す
る。
【0024】ブロック演算部21において、22は先に
従来の技術の項で説明した像域パラメータ決定部であ
る。本実施形態においては、ブロックサイズが8×8サ
イズであることと、直交変換として離散コサイン変換を
用いる点が異なる。24は、DCT変換部、25は空間
高調波係数演算部である。尚、20、24はJPEGや
MPEG方式等の標準規格で使用されている技術と同様
であり、詳細な原理は省略する。
【0025】像域パラメータ決定部22によって、文字
領域と中間調画像領域を分離するための特徴パラメータ
Lが計算される。しかし、本発明の実施形態の像域パラ
メータ分離処理では、文字領域の特徴が検出できるもの
であれば、他の方式であっても構わない。23は、属性
判定部であり、像域パラメータ分離部23の結果を閾値
と比較して、該当ブロックが文字領域であるかの判定を
行う。
【0026】26は、静止ブロック検出部であり、隣接
するフレームと比較し、特定位置の交流係数の変化が少
ないブロックを検出する。静止ブロック検出部26にお
いて、27はフレームメモリであり、前フレームの交流
係数を記憶する。また、28はブロック比較部であり、
フレームメモリ27の前フレームの交流係数と、DCT
変換部24で変換された現フレームの交流係数の比較を
行う。
【0027】<処理内容の説明>次に上記構成における
本実施形態の装置における処理内容を説明する。
【0028】本実施形態では、動画像に合成されたキャ
プション文字を検出する。特にキャプション文字の背後
に、無地の背景が合成されている画像を対象とする。
【0029】まず、動画の各フレームから文字らしい特
徴を持つ候補領域を検出する。同時に、前フレームの周
波数係数と比較を行ない、変化の少ない(動きの少な
い)領域を検出する。そして、候補領域で且つ変化の少
ない部分を文字領域と判定する。これはキャプション文
字の表示形態を利用したものである。すなわち、キャプ
ション文字は、ユーザが読み終るまでの十分な時間とし
て、数秒間は同じ位置に静止して表示される、という特
徴を有する。また、一方では、背景に表示されている物
体等は、物体自身の移動、又はカメラワーク等により動
きが生じることが多い。そこで、本実施形態では、静止
領域か否かを判定条件に加えることで、画像中の物体が
文字領域として判定されるのを防ぐ。
【0030】図1の構成で説明する。先ず、ブロック分
割部20では入力画像を小ブロックに分割する。小ブロ
ックデータは、ブロック単位で、DCT変換され、空間
高調波係数演算部25で文字らしさを表わす特徴量が算
出される。一方で、DCT係数は、静止ブロック検出部
26において、前フレームの対応する位置の小ブロック
の係数分布と比較が行われる。属性判定部23は、算出
した現フレームの小ブロックの特徴量が文字らしさの度
合が高く、且つ、前フレームの同位置の交流係数と比較
して変化が小さい場合、当該注目ブロックは文字である
と判定し、その結果を出力する。この比較処理の後、現
フレームの交流係数をフレームメモリ27に記憶する。
【0031】次に、各構成ブロック毎の動作を説明す
る。
【0032】図4は、ブロック比較部28の処理の流れ
を示すフローチャートであり、同図を用いて静止ブロッ
ク検出動作の説明を行なう。本実施形態のブロック比較
部28は、前フレーム中の該当するブロックと現フレー
ムの該当ブロックの各空間周波数係数との誤差を計算
し、全周波数に渡って積算する。これを閾値と比較し、
閾値以下の場合は、ブロック内の画像が静止していると
判定する。
【0033】図中、ステップS100では、フレームメ
モリ27の検索を行ない、前フレームの対応する位置の
ブロックの周波数係数を取り出す。ステップS101で
は、係数カウンタi,jや積算値レジスタ等の変数をク
リアする。ステップS102では、前フレームの周波数
係数と現フレーム中の該当する周波数係数との誤差を計
算する。i行j列の現フレームの周波数係数をAij、
前フレームの周波数係数をBijとすると、誤差Eij
は式(6)で計算される。
【0034】 Eij=Aij−Bij 式(6) 続くステップS103では、i行j列の係数の誤差を、
式(7)に従って積算する。
【0035】Err=Σ|Eij| 式(7) 尚、この式(7)は、Err←Err+|Eij|とし
ても表される。
【0036】ステップS104に処理が進むと、係数カ
ウンタi,jを更新する。ステップS105では、ブロ
ック内の全係数の比較が終了したか判定し、否定であれ
ばステップS102に戻り、上記処理を繰り返す。
【0037】さて、ステップS105の判定が肯定であ
れば、ブロック内の全ての係数についての誤差の積分値
がErrに格納されていることになる。そこで、ステッ
プS106に進み、積算値Errが、予め設定してある
静止判定閾値Ta以上であるか判定する。
【0038】Err<Taであれば、注目ブロックと前
フレームの該当するブロックの間にはほとんど変化がな
いと判断できるので、ステップS107に進み、「静止
フラグ」を出力し、本処理を終了する。また、Err≧
Taであると判断できた場合には、注目ブロックと前フ
レーム中の該当するブロックとの間には変化があったこ
とになるから、「静止フラグ」の出力は行なわない。
【0039】尚、ステップS107の処理は、属性判定
部23の出力信号をたとえば“1”にすることを意味
し、ステップS107の処理をスキップすることは、そ
の出力信号を“0”にさせたまま終了することを意味す
る。また、静止しているか否かの判定に用いた閾値Ta
は、文字領域の微小な揺れや変化を吸収できる程度の値
である。
【0040】以上の処理により、ブロック内の物体が静
止しているかを検出することができる。また、上記例で
は、直前の1フレームとの比較を行ったが、過去の複数
フレームを使用するようにしても良い。複数のフレーム
の周波数係数を記憶しておき、前後のフレームと比較す
るようにしても良い。更に、静止ブロックの判定方法と
して、本実施形態では各係数の誤差を積算する方法を示
したが、他の方法であっても良い。例えば、ブロック内
の全係数を積算してから差分をとるようにしも良いし、
パターンマッチングによる方法であっても本発明の趣旨
と何等異なるものではない。尚、上記処理は、ソフトウ
ェアによるものとして説明したが、これをロジック回路
で構成しても良いのは勿論である。
【0041】次に、本実施形態における属性判定部23
の処理内容を図5のフローチャートに従って説明する。
【0042】本実施形態の属性判定部23は、像域パラ
メータ決定部22の出力する特徴パラメータと、静止ブ
ロック検出部26の出力する「静止フラグ」から、当該
ブロックが文字であるかの判定を行なう。具体的には次
の通りである。
【0043】ステップS120では、メモリ部3から文
字判定閾値Tbを読み込む。ステップS121では、像
域パラメータ決定部22から特徴パラメータL、静止ブ
ロック検出部26から静止フラグの入力を行なう。ステ
ップS122では、入力した静止フラグに基づいて注目
ブロックが静止状態か否かを判定する。静止状態である
と判定した場合には、注目ブロックは文字領域ではない
と判断し、本処理を終了する。
【0044】一方、静止状態にあると判断した場合に
は、ステップS124に進み、入力した特徴パラメータ
Lと、先に読み込んだ閾値Tbと比較し、ステップS1
25でその比較結果に基づいて処理を分岐する。具体的
には、特徴パラメータLが閾値Tb以上であると判断し
た場合には、ステップS126に進み、注目ブロックは
文字領域であると判断し、その旨を出力信号として出力
する。また、特徴パラメータLが閾値Tb未満であると
判断した場合には、当該注目ブロックは文字領域ではな
いと判断し、本処理を終える。
【0045】尚、単純にブロック毎の判定結果を論理レ
ベルの異なる信号として出力するようにしてもよいし、
文字領域と判定されたブロックの画像をファイルに出力
するようにしてもよい。
【0046】以上の処理により、特徴パラメータが文字
判定閾値Tb以上であって静止したブロックのみを文字
領域として検出することができる。
【0047】以上説明したように本実施形態によれば、
フレーム間で係数分布を比較して領域判定することで、
フレーム毎のバラツキのない安定した領域抽出が可能と
なる。
【0048】尚、本発明は上記実施形態に限らず、幅広
く応用することが可能である。例えば、実施形態では、
直行変換の方法としてDCTを使用した例を示したが、
フーリエ変換やアダマール変換であっても良い。また、
像域パラメータ分離処理は、実施形態では、パラメータ
Lの値を計算して閾値と比較したが、文字領域の特徴を
検出する他の方法を用いても勿論構わない。また、属性
判定部では、静止ブロック判定によって閾値以上のブロ
ックを除去する例を説明したが、静止ブロックの判定に
よって閾値を補正するようにしても良い。これにより、
静止しているキャプション文字はより確実に検出され易
く、また、画像中のほぼ静止している文字領域も検出で
きるようになる。
【0049】また、上記処理は、パーソナルコンピュー
タ等の情報処理装置に備えられた拡張スロットに画像領
域検出部16を装着し、その中で処理するものとして説
明したが、情報処理装置のCPU1が十分高速演算でき
るものであれば、これに限るものではない。
【0050】この場合には、対応するプログラムをHD
D4やFDD6からメモリ部3内のRAMにロードし、
CPU1が実行することになる。尚、動画像の入力は、
通信インターフェース15を介して入力されるものとす
るが、これに限らず、如何なるインターフェースを介し
て受信しても良い。
【0051】<第2の実施形態>前述の第1の実施形態
では、ブロック内の全係数を比較して領域判定を行なっ
た。これは、無地背景上にキャプション文字が合成され
ているものを対象としたからである。しかしながら、変
化する背景上にキャプション文字が合成されている場合
には、小ブロックの係数分布はフレーム毎に変化するこ
ととなり、文字として検出が行なえない。本第2の実施
形態はこれに対応して、背景の影響を除去して領域抽出
率のさらなる向上を図るものである。以下では、小ブロ
ック内の特定部分の係数のみを取り出し、比較判定する
例について説明を行なう。
【0052】<画像領域検出部の説明(図6)>まず、
図6のブロック図を用いて、本第2の実施形態における
画像領域検出部16の構成を説明する。尚、他の構成要
素については、第1の実施形態と同様であるので、その
説明は省略する。同図においては、静止ブロック検出部
26の中に帯域分離部29を付加したことが、前述の第
1の実施形態と異なる。帯域分離部29は、DCT係数
の中からあらかじめ設定された部分の係数のみを取り出
す。そして、フレームメモリ27に記憶すると共に、ブ
ロック比較部28の係数データの入力とする。
【0053】<帯域分離部の説明(図7,図8)>以
下、本実施形態における帯域分離部29の動作を説明す
る。
【0054】まず、図7は、ブロック内における帯域分
割の様子を示す図である。同図において、8×8サイズ
の小ブロックは対角線で2分割されており、70はDC
T変換後の低周波領域、71は高周波領域の交流係数で
ある。
【0055】次に、図8は画像の種類による各周波数領
域の分布状況を表す図である。図中、80は小ブロック
に含まれる画像の種類、81は低周波領域の係数振幅の
割合、82は高周波領域の割合を示す。81と82は領
域内の係数の絶対値を積算し、ブロック全体に対する割
合を求めたものである。従って、これらの合算は丸め誤
差を除けば100になる。
【0056】また、83は文字(キャプション文字)画
像ブロック、84は中間調画像ブロック、85は文字と
中間調の混在画像ブロックの平均的な係数分布状況であ
る。これを見ると、画像種83は低周波と高周波領域が
半々であり、画像種84は大部分が低周波側に集中して
いる。また、画像種85は全域に渡って分布している
が、やや低周波側に片寄っている。
【0057】ここで、本実施形態での目的は、無地、又
は、動きのある背景上に合成されているキャプション文
字を検出することにあった。これらは、無地背景の文字
は画像種83、動く背景上の文字は画像種85と対応し
ており、本実施形態は画像種83と85のブロックを検
出できればよい。そして、静止ブロック検出部26は、
これら両ブロックの文字特徴を示す部分が静止している
ことを検出する。
【0058】これについて検討すると、低周波領域81
については、画像種83〜85で分布が集中している。
一方で、高周波領域82では、文字を含んでいる画像8
3と85の分布割合は多く、中間調画像のみの画像種8
4の分布割合は非常に少ない。従って、本実施形態の帯
域分離部29では、高周波領域71の交流係数を取り出
して、ブロックの動きを判定するのに使用する。i行j
列の交流係数をAijとすると、帯域分離部29は式
(8)に該当する交流係数のみを取り出して、フレーム
メモリ27、ブロック比較部28に出力する。
【0059】 Aij (i+j:7〜16) 式(8) この係数を入力するブロック比較部28の処理は、前述
の実施形態と同様であり、説明を省略する。
【0060】以上の処理を行なうことで、中間調の背景
の動きを除去して、文字特徴と示す部分の静止している
ことを検出することができる。
【0061】以上説明したように本第2の実施形態によ
れば、フレーム間で特定部分の係数比較を行って領域判
定することで、背景の動きを除去した安定した領域抽出
が可能となる。
【0062】なお、本発明は上述の実施形態に限られる
ことなく、幅広く応用することができる。上述の帯域分
離部の周波数帯域の分割方法は任意のものでよい。例え
ば、分割数も3つ以上にすることができ、分割形状も任
意のものでよい。本実施形態では特定帯域の係数のみを
取り込んで静止判定する例を説明したが、各帯域で重み
付けを行って判定するようにしてもよい。また、属性判
定部の判定条件として、隣接ブロックの判定結果を入れ
ることで、更に抽出率を向上させることができる。
【0063】<第3の実施形態>上記第1、第2の実施
形態では、パーソナルコンピュータ等の拡張スロットと
呼ばれる部分に、画像領域検出部16という拡張ボード
もしくはカードを装着し実現した。
【0064】しかしながら、動画像を取り込むインター
フェースを有し、尚且つ、CPU1がある程度の処理速
度を有している場合には、ソフトウェアでもって実現す
ることも可能である。
【0065】たとえば図2におけるFDD6に装着され
るフロッピーディスク、或いは、HDD4内のディスク
等の記憶媒体には、図11に示すようなプログラムモジ
ュールを格納させ、それを適宜メモリ部3内のRAMに
ロードすることで実現できる。
【0066】図11において、100は記憶媒体であ
り、101は直交変換を行うモジュール、102は直交
変換によって得られたデータに基づいて注目ブロックが
文字領域である可能性が高いか否かを判断するための第
1判断モジュール、103は前フレームにおける変換後
のブロックと現フレームの変換後のブロックを比較し、
変化が大きいか小さいかを判断するための第2判断モジ
ュール、104は第1判断モジュール102及び第2判
断モジュール103の判断結果に基づいて注目ブロック
が文字領域であるか否かを識別し、その判断結果を上位
処理に返す識別モジュールである。
【0067】また、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器からなる装置に適
用してもよい。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることは言うまでもない。この場合、本発明に係る
プログラムを格納した記憶媒体が、本発明を構成するこ
とになる。そして、該記憶媒体からプログラムをシステ
ム或は装置に読み出すことによって、そのシステム或は
装置が、予め定められたし方で動作する。
【0068】
【発明の効果】以上説明したように本発明によれば、背
景の動きによる影響を除去して、高い抽出率で安定した
画像、特に文字領域を切り出しを行うことが可能にな
る。
【0069】
【図面の簡単な説明】
【図1】実施形態における画像領域検出部の構成を示す
ブロック図である。
【図2】実施形態における画像処理装置の概略構成を示
すブロック図である。
【図3】実施形態における文字領域抽出動作の画像例を
示す図である。
【図4】図1における静止ブロック検出部の処理内容を
示すフローチャートである。
【図5】図1における属性判定部23の処理内容を示す
フローチャートである。
【図6】第2の実施形態における画像領域検出部の構成
を示すブロック図である。
【図7】図6の帯域分離部で分離する領域を示す図であ
る。
【図8】帯域領域分離による属性判断テーブルを示す図
である。
【図9】従来技術におけるジグザグスキャン処理の順序
を説明する図である。
【図10】従来技術における係数の積算領域を説明する
図である。
【図11】第3の実施形態におけるプログラムを記憶し
た記憶媒体の内容を模式的に示す図である。
【符号の説明】 1 CPU 2 周辺コントローラ 3 メモリ部 4 ハードディスクドライブ(HDD) 5 FDD制御部 6 FDDドライブ 7 キーボード制御部 8 キーボード 9 表示ユニット 10 表示制御部 11 VRAM 12 液晶ディスプレイ 13 通信ユニット 14 通信制御部 15 通信インターフェース 16 画像領域検出部 20 ブロック分割部 21 ブロック演算部 22 像域パラメータ決定部 23 属性判定部 24 DCT変換部 25 空間高調波係数演算部 26 静止ブロック検出部 27 フレームメモリ 28 ブロック比較部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 連続してフレーム画像を入力し、入力し
    た画像データを空間周波数軸上のデータに変換し、当該
    空間周波数の特性に基づいて領域を判別する画像処理装
    置であって、 入力したフレーム画像データを所定ブロック毎に直交変
    換する変換手段と、 該変換手段による直交変換された結果に基づいて現フレ
    ーム中の注目ブロックの属性を判断する第1の判断手段
    と、 従前に入力された少なくとも1つのフレーム画像におけ
    る直交変換結果に基づいて、現フレーム中の注目ブロッ
    クの属性を判断する第2の判断手段と、 前記第1、第2の判断手段の判断結果に基づいて、注目
    ブロックの属性を識別する識別手段とを備えることを特
    徴とする画像処理装置。
  2. 【請求項2】 前記変換手段は、離散コサイン変換であ
    ることを特徴とする請求項第1項に記載の画像処理装
    置。
  3. 【請求項3】 前記変換手段は、アダマール変換である
    ことを特徴とする請求項第1項に記載の画像処理装置。
  4. 【請求項4】 前記第1の判断手段は、 直交変換後におけるブロック内の係数の合計を算出する
    算出手段と、 算出された合計値と所定の閾値とを比較する比較手段と
    を含むことを特徴とする請求項第1項に記載の画像処理
    装置。
  5. 【請求項5】 前記第2の判断手段は、 少なくとも現フレームの注目ブロックの直交変換後の各
    係数と、前フレームの該当する変換後の各係数の差分の
    合計を算出する第2の算出手段と、 算出された合計値と所定の閾値とを比較する比較手段と
    を含むことを特徴とする請求項第1項に記載の画像処理
    装置。
  6. 【請求項6】 更に、注目ブロックに対する前記直交変
    換後のデータに基づいて所定の帯域における特徴量を抽
    出する抽出手段を備え、 前記識別手段は、当該抽出手段で得られた結果を含め
    て、注目ブロックの属性を識別することを特徴とする請
    求項第1項に記載の画像処理装置。
  7. 【請求項7】 連続してフレーム画像を入力し、入力し
    た画像データを空間周波数軸上のデータに変換し、当該
    空間周波数の特性に基づいて領域を判別する画像処理方
    法であって、 入力したフレーム画像データを所定ブロック毎に直交変
    換する変換工程と、 該変換工程による直交変換された結果に基づいて現フレ
    ーム中の注目ブロックの属性を判断する第1の判断工程
    と、 従前に入力された少なくとも1つのフレーム画像におけ
    る直交変換結果に基づいて、現フレーム中の注目ブロッ
    クの属性を判断する第2の判断工程と、 前記第1、第2の判断工程の判断結果に基づいて、注目
    ブロックの属性を識別する識別工程とを備えることを特
    徴とする画像処理方法。
  8. 【請求項8】 前記変換工程は、離散コサイン変換であ
    ることを特徴とする請求項第7項に記載の画像処理方
    法。
  9. 【請求項9】 前記変換工程は、アダマール変換である
    ことを特徴とする請求項第7項に記載の画像処理方法。
  10. 【請求項10】 前記第1の判断工程は、 直交変換後におけるブロック内の係数の合計を算出する
    算出工程と、 算出された合計値と所定の閾値とを比較する比較工程と
    を含むことを特徴とする請求項第7項に記載の画像処理
    方法。
  11. 【請求項11】 前記第2の判断工程は、 少なくとも現フレームの注目ブロックの直交変換後の各
    係数と、前フレームの該当する変換後の各係数の差分の
    合計を算出する第2の算出工程と、 算出された合計値と所定の閾値Tbとを比較する比較工
    程とを含むことを特徴とする請求項第7項に記載の画像
    処理方法。
  12. 【請求項12】 更に、注目ブロックに対する前記直交
    変換後のデータに基づいて所定の帯域における特徴量を
    抽出する抽出工程を備え、 前記識別工程は、当該抽出工程で得られた結果を含め
    て、注目ブロックの属性を識別することを特徴とする請
    求項第7項に記載の画像処理方法。
  13. 【請求項13】 メモリ媒体から所定のプログラムを読
    み込むことで、連続して入力したフレーム画像データを
    空間周波数軸上のデータに変換し、当該空間周波数の特
    性に基づいて領域を判別する画像処理装置であって、 前記メモリ媒体は、 入力したフレーム画像データを所定ブロック毎に直交変
    換する変換工程の手順コードと、 該変換による直交変換された結果に基づいて現フレーム
    中の注目ブロックの属性を判断する第1の判断工程の手
    順コードと、 複数のフレーム画像における直交変換結果に基づいて、
    現フレーム中の注目ブロックの属性を判断する第2の判
    断工程の手順コードと、 前記第1、第2の判断工程の手順コードによる手順の結
    果に基づいて、注目ブロックの属性を識別する識別工程
    の手順コードとを備えることを特徴とする画像処理装
    置。
JP19639095A 1995-08-01 1995-08-01 画像処理装置および方法 Expired - Fee Related JP3733161B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP19639095A JP3733161B2 (ja) 1995-08-01 1995-08-01 画像処理装置および方法
US08/681,958 US5828782A (en) 1995-08-01 1996-07-30 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19639095A JP3733161B2 (ja) 1995-08-01 1995-08-01 画像処理装置および方法

Publications (2)

Publication Number Publication Date
JPH0946519A true JPH0946519A (ja) 1997-02-14
JP3733161B2 JP3733161B2 (ja) 2006-01-11

Family

ID=16357081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19639095A Expired - Fee Related JP3733161B2 (ja) 1995-08-01 1995-08-01 画像処理装置および方法

Country Status (2)

Country Link
US (1) US5828782A (ja)
JP (1) JP3733161B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003348360A (ja) * 2002-04-25 2003-12-05 Microsoft Corp 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
JP2006216031A (ja) * 1997-09-24 2006-08-17 Ricoh Co Ltd 画像特徴抽出方法及び装置
JPWO2006018970A1 (ja) * 2004-08-19 2008-05-08 パイオニア株式会社 テロップ検出方法、テロップ検出プログラム、およびテロップ検出装置
WO2008139825A1 (ja) * 2007-05-08 2008-11-20 Olympus Corporation 画像処理装置および画像処理プログラム
WO2009104315A1 (ja) * 2008-02-21 2009-08-27 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP2013034152A (ja) * 2011-08-03 2013-02-14 Nippon Telegr & Teleph Corp <Ntt> 映像静止判定方法、映像静止判定装置、及びプログラム
KR101347979B1 (ko) * 2013-01-14 2014-01-08 한양대학교 에리카산학협력단 표적 검출을 위해 적외선 영상의 잡음 제거 방법 및 장치
JP2014078786A (ja) * 2012-10-09 2014-05-01 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理方法を記録した記録媒体

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219382B1 (en) * 1996-11-25 2001-04-17 Matsushita Electric Industrial Co., Ltd. Method and apparatus for locating a caption-added frame in a moving picture signal
JPH10233693A (ja) * 1996-12-16 1998-09-02 Canon Inc 画像処理方法及び装置並びに記憶媒体
US6269173B1 (en) * 1998-05-15 2001-07-31 Onemore Inc. Instant response broadcast board system and method
US6738524B2 (en) * 2000-12-15 2004-05-18 Xerox Corporation Halftone detection in the wavelet domain
US6704467B2 (en) 2000-12-21 2004-03-09 Canon Kabushiki Kaisha Image editing with block selection
US7239748B2 (en) * 2003-08-12 2007-07-03 International Business Machines Corporation System and method for segmenting an electronic image
JP2005078528A (ja) * 2003-09-02 2005-03-24 Honda Motor Co Ltd 物体検出装置及び方法
GB2409029A (en) * 2003-12-11 2005-06-15 Sony Uk Ltd Face detection
US20060165287A1 (en) * 2005-01-27 2006-07-27 Destiny Technology Corporation Photo and text discriminating method
JP2008269396A (ja) * 2007-04-23 2008-11-06 Sony Corp 画像処理装置、画像処理方法、およびプログラム
KR101353304B1 (ko) * 2008-10-24 2014-01-21 에스케이 텔레콤주식회사 적응적 보간 필터 계수를 이용한 영상 부호화/복호화 방법 및 장치
US8942484B2 (en) * 2011-09-06 2015-01-27 Qualcomm Incorporated Text detection using image regions
US9471833B1 (en) * 2012-04-03 2016-10-18 Intuit Inc. Character recognition using images at different angles
GB2578633B (en) * 2018-11-02 2021-10-13 Advanced Risc Mach Ltd Encoding data arrays
US11687258B2 (en) 2021-09-08 2023-06-27 Hewlett Packard Enterprise Development Lp Operational feature activation/disabling

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201182A (ja) * 1982-05-20 1983-11-22 Nippon Telegr & Teleph Corp <Ntt> 文字・図形切り分け方法
JPH0759086A (ja) * 1993-07-30 1995-03-03 Canon Inc 画像処理装置
JPH0774966A (ja) * 1993-09-02 1995-03-17 Canon Inc 画像処理装置
JPH07192003A (ja) * 1993-12-27 1995-07-28 Hitachi Ltd 動画像検索装置及び方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02202771A (ja) * 1989-01-31 1990-08-10 Nec Corp ファクシミリ装置
US5101438A (en) * 1990-02-02 1992-03-31 Ricoh Company, Ltd. Method of discriminating different kinds of image areas, involving two-dimensional orthogonal transforms

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201182A (ja) * 1982-05-20 1983-11-22 Nippon Telegr & Teleph Corp <Ntt> 文字・図形切り分け方法
JPH0759086A (ja) * 1993-07-30 1995-03-03 Canon Inc 画像処理装置
JPH0774966A (ja) * 1993-09-02 1995-03-17 Canon Inc 画像処理装置
JPH07192003A (ja) * 1993-12-27 1995-07-28 Hitachi Ltd 動画像検索装置及び方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006216031A (ja) * 1997-09-24 2006-08-17 Ricoh Co Ltd 画像特徴抽出方法及び装置
JP2003348360A (ja) * 2002-04-25 2003-12-05 Microsoft Corp 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
JPWO2006018970A1 (ja) * 2004-08-19 2008-05-08 パイオニア株式会社 テロップ検出方法、テロップ検出プログラム、およびテロップ検出装置
JP4700002B2 (ja) * 2004-08-19 2011-06-15 パイオニア株式会社 テロップ検出方法、テロップ検出プログラム、およびテロップ検出装置
US8126055B2 (en) 2004-08-19 2012-02-28 Pioneer Corporation Telop detecting method, telop detecting program, and telop detecting device
WO2008139825A1 (ja) * 2007-05-08 2008-11-20 Olympus Corporation 画像処理装置および画像処理プログラム
WO2009104315A1 (ja) * 2008-02-21 2009-08-27 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP2013034152A (ja) * 2011-08-03 2013-02-14 Nippon Telegr & Teleph Corp <Ntt> 映像静止判定方法、映像静止判定装置、及びプログラム
JP2014078786A (ja) * 2012-10-09 2014-05-01 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理方法を記録した記録媒体
KR101347979B1 (ko) * 2013-01-14 2014-01-08 한양대학교 에리카산학협력단 표적 검출을 위해 적외선 영상의 잡음 제거 방법 및 장치

Also Published As

Publication number Publication date
JP3733161B2 (ja) 2006-01-11
US5828782A (en) 1998-10-27

Similar Documents

Publication Publication Date Title
JPH0946519A (ja) 画像処理装置および方法
US6259823B1 (en) Signal adaptive filtering method and signal adaptive filter for reducing blocking effect and ringing noise
US7706446B2 (en) Image-data processing apparatus
EP1781041B1 (en) JPEG detectors and JPEG image history estimators
EP1280107A2 (en) Quality based image compression
US20060238653A1 (en) Image processing apparatus, image processing method, and computer program
US8300101B2 (en) Image processing method, image processing system, image pickup device, image processing device and computer program for manipulating a plurality of images
JPH10327334A (ja) リンギングノイズの減少のための信号適応フィルタリング方法及び信号適応フィルター
JPH07121656A (ja) 画像像域分離装置
JP2011091510A (ja) 画像処理装置およびその制御方法
JP4078085B2 (ja) 変倍画像生成装置、方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体
JPH10233693A (ja) 画像処理方法及び装置並びに記憶媒体
JP2009212605A (ja) 情報処理方法、情報処理装置及びプログラム
US8064707B2 (en) Image recognition method and image recognition apparatus
JP2000013605A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JPH09186858A (ja) 画像処理方法及び装置、及びコンピュータ制御装置
JP3792762B2 (ja) 画像処理装置および画像処理方法
KR100473944B1 (ko) 디지털 영상신호의 텍스트 추출방법
JP2000013612A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP3774498B2 (ja) 画像処理方法とその装置
JP2000013613A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JPH0916769A (ja) 画像処理装置および方法
JP2002133414A (ja) 画像処理方法及びその装置、記憶媒体
JPH0774966A (ja) 画像処理装置
JPH11136674A (ja) 画像符号化方法及び記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051017

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101021

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111021

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121021

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131021

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees