JP4420811B2 - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP4420811B2
JP4420811B2 JP2004368967A JP2004368967A JP4420811B2 JP 4420811 B2 JP4420811 B2 JP 4420811B2 JP 2004368967 A JP2004368967 A JP 2004368967A JP 2004368967 A JP2004368967 A JP 2004368967A JP 4420811 B2 JP4420811 B2 JP 4420811B2
Authority
JP
Japan
Prior art keywords
data
picture
scene change
pixels
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004368967A
Other languages
English (en)
Other versions
JP2006180020A (ja
Inventor
恭啓 山崎
雅之 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2004368967A priority Critical patent/JP4420811B2/ja
Priority to US11/089,359 priority patent/US7542609B2/en
Publication of JP2006180020A publication Critical patent/JP2006180020A/ja
Application granted granted Critical
Publication of JP4420811B2 publication Critical patent/JP4420811B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、入力動画像データを基にシーンチェンジを検出する画像処理装置およびその方法に関し、特に、ピクチャのデータを画素を間引いて受信してシーンチェンジ検出に利用する画像処理装置およびその方法に関する。
近年、MPEG(Moving Picture Experts Group)等の圧縮符号化方式を用いて、動画像をデジタルデータとして取り扱うことが一般的となっている。例えば、テレビ放送を受信し、デジタルデータとして光ディスク等の記録媒体に記録するビデオレコーダの普及が進んでいる。
動画像は通常、1秒間に数十回程度の静止画像を切り替えることで表示され、各静止画像はフレーム(インタレース方式ではフィールド)と呼ばれる。動画像をMPEG方式等で圧縮符号化すると、各フレームにはI,B,Pのいずれかの属性が付与される。Iフレームは、時間的な差の情報を持たずに単独で構成されるフレームであり、Pフレームは、時間的に前のフレームから予測符号化されるフレームであり、Bフレームは、時間的に前後の両フレームから予測符号化されるフレームである。
一般的に、動画像の前後のフレームは相関が高いため、IフレームよりPフレームやBフレームの方がデータ圧縮率が高い。しかし、動画像データの先頭にはIフレームが必須であり、またIフレームには、画像編集が容易で、早送りや逆再生時に素早く表示できるといった利点もあることから、通常は十数フレーム〜数百フレームに1回はIフレームが挿入される。通常の符号化では、1つ以上のIフレーム(またはフィールド)を含む独立した再生単位としてGOP(Group Of Picture)が規定され、このGOPで決められた一定の順序でI,B,Pのいずれかのフレームが繰り返し生成されていく。これにより、高いデータ圧縮効率と、ランダムアクセス性能等の利便性とを両立させている。
しかし、このようなGOPの規定通りに画像を生成すると、シーンチェンジの境界部では、高いデータ圧縮効果が得られない場合がある。シーンチェンジは例えば、ビデオ録画中に一時停止し、その後に録画を再開した場合や、テレビ番組の途中でコマーシャルに切り替わった場合等に発生し、シーンチェンジの直後のフレームは、その前のフレームに対して非常に相関の低いフレームとなる。このため、シーンチェンジの直後にBフレームあるいはPフレームを生成すると、データ圧縮効果が低くなり、その画質も低いものになってしまう。そこで、シーンチェンジを検出して、符号化するピクチャの属性を制御する方法が考えられている。
図9は、シーンチェンジ検出回路を含むMPEG符号化のための従来の回路構成を概略的に示す図である。
図9では例として、GOPの規定により符号化対象のフレームがPフレームとされる場合のデータの流れについて示している。この図9において、差分検出部501は、符号化対象のフレームとその直前のフレームとの差分を演算する。シーンチェンジ検出部502は、符号化対象のフレームとその直前のフレームの各データから、シーンチェンジを検出する。セレクタ503は、差分検出部501からの差分データと、符号化対象のフレームのデータのいずれかを、シーンチェンジ検出信号に応じて選択して出力する。データ圧縮部504は、セレクタ503により選択出力されたデータを圧縮符号化処理する。
この回路においては、シーンチェンジ検出部502によりシーンチェンジの発生が検出されなかった場合には、セレクタ503により差分検出部501からのデータが選択される。これにより、符号化対象のフレームとその直前のフレームとの差分データを基に圧縮符号化処理が行われ、Pフレームが出力される。一方、シーンチェンジ検出部502により、符号化対象のフレームでシーンチェンジが発生したことが検出された場合には、セレクタ503により符号化対象のフレームのデータが選択され、このフレームのみを用いて圧縮符号化が行われ、Iフレームが出力される。
このような回路構成により、シーンチェンジが発生した場合には、GOPの規定にかかわらず、その直後のフレームがIフレームとされて、データ圧縮効果の低い無駄なフレーム間予測符号化処理が行われなくなり、画質を改善することができる。また、早送り再生等によりシーンチェンジ後の先頭フレームを確実にサーチしたり、この先頭フレームについてインデックスのためのサムネイル画像を容易に生成できるようにもなる。
シーンチェンジ検出のためには、フレーム間の画素差分を採る画素差分法が一般的に用いられている。この方法では、フレーム間の同一の位置にある画素同士のデータ差分の絶対値を積算し、あらかじめ設定したしきい値より大きい場合にシーンチェンジが発生したと判断する。さらに、この方法を応用したものとして、画素対応のフレーム間差分を累積加算した値に相当する第1の画像相関値を求め、この第1の画像相関値のフレーム間差分に相当する第2の画像相関値を求め、第2の画像相関値がしきい値を超えたときにシーンチェンジの発生を検出することで、動きの激しい動画像でも実際のシーンチェンジのみをより確実に検出するようにした方法もあった(例えば、特許文献1参照)。
また、シーンチェンジの他の検出方法としては、フレーム間の画像の動きを検出する動きベクトル法がある。この方法では、小さく区切られた矩形領域のそれぞれに対して同一の画像がないか否かを検出し、一致するものがない領域が多数を占めた場合に、シーンチェンジが発生したと判断する。
特開2000−324499号公報(段落番号〔0020〕〜〔0027〕、図2)
ところで、上述した2つのシーンチェンジ検出方法のうち、動きベクトル法は、画素差分法より高い精度でシーンの切り替わりを検出することができるが、複雑な処理が必要となる。しかし、最近では、画像符号化に対して処理負荷や回路規模、製造コストの抑制が強く要望されており、画素差分法を用いてより検出精度を高めることが望まれている。
しかし、画素差分法を用いた場合でも、図9に示したように、データの圧縮符号化処理と、シーンチェンジ検出処理との双方とのために複数フレーム分の画像データを回路内に読み込む必要が生じることから、データを伝送するシステムバスの負荷が大きくなる。このため、システムバスの転送速度を高める必要が生じ、回路規模や製造コストの抑制を阻害する要因となっていた。
本発明はこのような点に鑑みてなされたものであり、シーンチェンジ検出の精度を低下させることなく、画像データの転送時におけるデータバスの負荷が軽減されて、製造コストが低減された画像処理装置を提供することを目的とする。
また、本発明の他の目的は、シーンチェンジ検出の精度を低下させることなく、画像データの転送時におけるデータバスの負荷を軽減して、製造コストを低減できる画像処理方法を提供することである。
本発明では上記課題を解決するために、図1に示すような画像処理装置が提供される。この画像処理装置は、入力動画像データを基にシーンチェンジを検出するものであり、検出対象のピクチャ21のデータとその直前のピクチャ22のデータとを画素を間引いて受信し、前記検出対象および前記直前の各ピクチャ21および22間のデータの差分値を基にシーンチェンジを検出するシーンチェンジ検出部11と、少なくとも前記直前のピクチャ22について、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置12から連続的に読み出すとともに、前記記憶装置12から前記画素群間の間隔を空けてデータを読み出し、データバス13を通じて前記シーンチェンジ検出部11に転送するように制御し、前記画素群に含まれる画素数pを、バス幅に応じて決定される前記データバス13での転送可能な最大数、またはその整数倍の数とした転送制御部14とを有することを特徴とする。
ここで、シーンチェンジ検出部11は、検出対象のピクチャ21のデータとその直前のピクチャ22のデータとの差分値を基にシーンチェンジを検出する。このとき、各ピクチャ21および22について画素を間引いて受信することで、検出処理が高速化される。転送制御部14は、検出対象およびその直前の各ピクチャ21および22のうちの少なくとも直前のピクチャ22については、そのピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置12から連続的に読み出すとともに、この記憶装置12から画素群間の間隔を空けてデータを読み出し、データバス13を通じてシーンチェンジ検出部11に転送するように制御する。このとき、画素群に含まれる画素数pを、バス幅に応じて決定されるデータバス13での転送可能な最大数、またはその整数倍の数とすることで、データバスの利用効率が高められて、検出に使用する画素数を少なくすることなく、画像データの転送に要する時間が短縮される。
また、本発明では、入力動画像データを基にシーンチェンジを検出するための画像処理方法において、転送制御部が、検出対象のピクチャおよびその直前のピクチャのうち、少なくとも前記直前のピクチャについて、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置から連続的に読み出すとともに、前記記憶装置から前記画素群間の間隔を空けてデータを読み出し、データバスを通じて検出処理部に転送するように制御し、前記画素群に含まれる画素数を、バス幅に応じて決定される前記データバスでの転送可能な最大数、またはその整数倍の数としたデータ転送ステップと、前記検出処理部が、前記データバスを通じて受信した前記検出対象および前記直前の各ピクチャのデータの差分値を演算し、その演算結果を基にシーンチェンジを検出する検出処理ステップとを含むことを特徴とする画像処理方法が提供される。
ここで、データ転送ステップでは、シーンチェンジの検出対象のピクチャおよびその直前のピクチャのうち、少なくとも直前のピクチャについて、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置から連続的に読み出すとともに、この記憶装置から画素群間の間隔を空けてデータを読み出し、データバスを通じて検出処理部に転送するように制御する。検出処理ステップでは、データバスを通じて受信した検出対象および直前の各ピクチャのデータの差分値を演算し、その演算結果を基にシーンチェンジを検出する。このとき、ピクチャ内の画素が間引かれて受信されるので、検出処理が高速化される。これに加えて、データ転送ステップでは、画素群に含まれる画素数が、バス幅に応じて決定されるデータバスでの転送可能な最大数、またはその整数倍の数とされるので、データバスの利用効率が高められ、検出に使用する画素数を少なくすることなく、画像データの転送に要する時間が短縮される。
本発明の画像処理装置によれば、シーンチェンジの検出対象およびその直前のピクチャのうち、少なくとも直前のピクチャについては、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータが記憶装置から連続的に読み出されるとともに、この記憶装置から画素群間の間隔を空けてデータが読み出され、データバスを通じて検出処理部に転送される。このとき、画素群に含まれる画素数を、バス幅に応じて決定されるデータバスでの転送可能な最大数、またはその整数倍の数としたことで、データバスの利用効率が高められて、検出に使用する画素数を少なくすることなく、画像データの転送に要する時間が短縮される。従って、シーンチェンジの検出精度を低下させることなく、データバスの負荷を低減することができ、製造コストを低減できる。
また、本発明の画像処理方法によれば、シーンチェンジの検出対象およびその直前のピクチャのうち、少なくとも直前のピクチャについては、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータが記憶装置から連続的に読み出されるとともに、この記憶装置から画素群間の間隔を空けてデータが読み出され、データバスを通じて検出処理部に転送される。このとき、画素群に含まれる画素数を、バス幅に応じて決定されるデータバスでの転送可能な最大数、またはその整数倍の数としたことで、データバスの利用効率が高められて、検出に使用する画素数を少なくすることなく、画像データの転送に要する時間が短縮される。従って、シーンチェンジの検出精度を低下させることなく、データバスの負荷を低減することができ、製造コストを低減できる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は、実施の形態に係る画像処理装置の動作の概要を示す図である。
図1では、入力動画像データを基にシーンチェンジを検出するための画像処理装置の主な機能の構成を示している。この画像処理装置は、シーンチェンジを検出するシーンチェンジ検出部11と、画像データを一時的に記憶する記憶装置12と、記憶装置12からシーンチェンジ検出部11へのデータバス13を通じた画像データの転送を制御する転送制御部14とを具備する。
シーンチェンジ検出部11は、検出対象のピクチャ21と、その直前のピクチャ22の各データの差分値を基にシーンチェンジを検出する。このシーンチェンジ検出部11は、各ピクチャ21および22の全画素ではなく、画素を間引いて受信して、各ピクチャ21および22の対応する位置の画素同士の差分値を算出する。これにより、処理時間を短縮している。
転送制御部14は、記憶装置12に読み出しアドレスを発行して、データの読み出しと、データバス13を通じたシーンチェンジ検出部11へのデータ転送とを制御する。この転送制御部14は、例えばCPUやDMA(Direct Memory Access)コントローラ等として実現される。
このような画像処理装置において、検出対象のピクチャ21およびその直前のピクチャ22のうち、少なくとも直前のピクチャ22は、記憶装置12に一旦記憶された後、シーンチェンジ検出部11に供給される。このとき、転送制御部14の制御により、ピクチャ22のデータは画素を間引いて読み出され、データバス13を通じてシーンチェンジ検出部11に供給される。また、検出対象のピクチャ21は、例えば外部のビデオキャプチャ部や通信I/F等から、直接シーンチェンジ検出部11に供給されてもよく、あるいは記憶装置12に一旦記憶されてから供給されてもよい。記憶装置12に記憶された場合には、直前のピクチャ22と同様に画素を間引いて読み出され、シーンチェンジ検出部11に転送される。
ここで、転送制御部14は、記憶装置12からピクチャを読み出す際に、一定の画素数p分だけ連続して読み出し、その他の画素を間引く。このとき、画素数pを、データバス13のバス幅に応じて決定されるデータバス13上での転送可能な最大数とする。例えば、1画素分のデータが1バイトで、バス幅が32ビットの場合、記憶装置12からの1回の読み出しで最大4画素分のデータを転送可能であるので、画素数pを4とする。あるいは、システムが破綻しないことを保証できれば、画素数pをバス幅に応じた転送可能な最大数の整数倍とすることもできる。
シーンチェンジ検出部11では、より多くの画素を検出対象とするほど検出精度が高められるが、同じ画素数を転送するのであれば、上記条件で一定数の画素を連続的に転送することで、検出精度を維持しつつ、画像データの転送に要する時間を短縮することができる。従って、シーンチェンジの検出精度を低下させることなく、データバス13の負荷を低減し、製造コストを低減することができる。
また、データバス13では一般的に、記憶装置12の読み出しや書き込みの対象データの総サイズが同じであっても、読み出し要求や書き込み要求が行われる時間間隔が広い方がシステムの破綻が少なくなる。このため、読み出し対象となる画素数pの隣接画素が割り当てられた水平方向のラインが複数存在するとき、このような1ライン上において連続して読み出しを間引く最大画素数より、全画素の読み出しが間引かれる連続したラインの最大数を小さくすることが望ましい。これにより、読み出し間隔が平均的に広くなるので、シーンチェンジの検出精度を低下させることなく、システムに冗長性を持たせ、安定的な動作が可能となる。
さらにこの条件に加えて、読み出し対象となる画素数pの隣接画素が割り当てられた複数のラインの間で、この隣接画素の水平方向の位置を互い違いにすることが望ましい。これにより、シーンチェンジの検出に用いる画素のピクチャ上の位置を分散させることができ、動作を安定化させながらも検出精度を一層高めることができる。
次に、画像処理装置のより具体的な構成例について説明する。ここでは、テレビ放送を受信して画像信号をデジタル化し、MPEG方式で圧縮符号化する装置を例に挙げて説明する。
図2は、実施の形態に係る画像処理装置の具体的な構成例を示す図である。
図2に示す画像処理装置は、チューナ回路101、ビデオキャプチャ回路102、転送エンジン回路103、シーンチェンジ検出回路104、DRAM(Dynamic Random Access Memory)105、ビデオエンコーダ106、およびCPU107を具備する。これらのうち、転送エンジン回路103、シーンチェンジ検出回路104、DRAM105、ビデオエンコーダ106、およびCPU107は、システムバス108を介して互いに接続されており、データを送受信することが可能となっている。
チューナ回路101は、所定の搬送周波数の放送電波を外部のアンテナを通じて受信し、受信信号を復調してアナログ画像信号を出力する。ビデオキャプチャ回路102は、チューナ回路101からのアナログ画像信号を非圧縮のデジタル画像データとして取り込む。転送エンジン回路103は、システムバス108のI/Fであり、CPU107からの命令に応じてビデオキャプチャ回路102からの画像データをシステムバス108を通じて転送する。
シーンチェンジ検出回路104は、検出対象およびその直前の画像データ(ピクチャ)をシステムバス108を通じて受信し、各ピクチャの差分値を基にシーンチェンジを検出する。DRAM105は、シーンチェンジ検出回路104やビデオエンコーダ106等の処理時の作業領域となり、CPU107の制御の下で画像データを一時的に保持する。
ビデオエンコーダ106は、CPU107の制御の下で、DRAM105に記憶された画像データをMPEG方式で順次圧縮符号化し、ビデオES(Elementary Stream)を出力する。ビデオESは例えば、同時に符号化されたオーディオESと多重化されて、HDD(Hard Disk Drive)等の記憶装置に記憶されたり、あるいは通信I/Fを通じて外部の機器に送信される。なお、このビデオエンコーダ106の機能あるいはその一部は、CPU107によるソフトウェア処理により実現されてもよい。CPU107は、この画像処理装置を統括的に制御する回路であり、システムバス108を通じて各部の動作を制御するとともに、システムバス108上のデータ転送を制御する。
この画像処理装置では、チューナ回路101で受信されたテレビ画像がビデオキャプチャ回路102によりデジタル変換され、デジタル画像データが転送エンジン回路103を通じてシステムバス108上に供給される。供給された画像データは、DRAM105に一旦格納された後、ビデオエンコーダ106によって圧縮符号化される。
また、このような処理の間、シーンチェンジ検出回路104は順次供給される画像データからシーンチェンジの有無を検出し、シーンチェンジが発生すると、検出信号をビデオエンコーダ106に出力する。ビデオエンコーダ106は、検出信号を受信すると、次に符号化するピクチャがGOPの規則ではBピクチャあるいはPピクチャであるタイミングであっても、次のピクチャとしてIピクチャを生成する。これにより、シーンチェンジの直後に生成される画像の画質を高め、無駄なデータ圧縮処理を行わないようにすることができる。
図3は、シーンチェンジ検出回路104の構成例を示す図である。
シーンチェンジ検出回路104は、例えば図3のように、減算部41、絶対値演算部42、加算部43、積算レジスタ44、および比較部45を具備する。減算部41には、検出対象のピクチャ21およびその直前のピクチャ22の対応する画素のデータが順次入力される。減算部41は、各ピクチャ21および22の画素データの差分値を出力し、絶対値演算部42は、減算部41からの差分値の絶対値を演算する。
加算部43は、絶対値演算部42からの出力値と積算レジスタ44の出力値とを加算し、積算レジスタ44に出力する。積算レジスタ44は、加算部43の加算結果を保持し、その値を比較部45に出力するとともに、加算部43にフィードバックする。これにより、ピクチャ21および22の対応画素間の差分値の絶対値が順次積算され、積算レジスタ44に格納される。なお、積算レジスタ44は、1つのピクチャからの検出が終了されるとリセットされる。
比較部45は、積算レジスタ44の値と所定のしきい値とを比較し、積算レジスタ44からの値がしきい値を超えたときにシーンチェンジが発生したと判定し、検出信号を出力する。
なお、以上のシーンチェンジ検出回路104内の各機能は、各種ゲート回路等のハードウェアにより実現されてもよいし、あるいはCPU107によるソフトウェア処理により実現されてもよい。
ところで、シーンチェンジ検出回路104は、減算部41において、各ピクチャ21および22のデータを全画素分受信せずに、画素を間引いて受信することで、処理速度を高速化している。また、本実施の形態では、直前のピクチャ22のデータについては、CPU107の制御によりDRAM105から間引いて読み出すことで取得するが、検出対象のピクチャ21のデータについては、ビデオキャプチャ回路102から転送エンジン回路103を通じて直接取得するものとする。すなわち、ビデオキャプチャ回路102により生成されたピクチャ21のデータは、全画素分がシステムバス108を通じてDRAM105に格納されるとともに、シーンチェンジ検出回路104にも供給され、シーンチェンジ検出回路104は、受信したピクチャ21のうち必要な画素のデータだけを間引いて取り込む。
なお、以下の例では、システムバス108のデータ転送のためのバス幅を32ビット、ピクチャの1画素分のデータを1バイトとする。
図4は、シーンチェンジ検出に使用する画素位置の例を示す図である。この図4では、DRAM105に一旦記憶したピクチャのデータのうち、検出に使用するために読み出す画素を白く表し、それ以外の間引く画素を斜線で表している(以下の図6,図7も同様とする)。
システムバス108のバス幅が32ビットの場合、DRAM105から1画素分のデータ(1バイト)を読み出した場合と、隣接する4画素分のデータ(4バイト)を読み出した場合とでは、システムバス108への負荷は変わらず、ともに同じ時間だけシステムバス108を占有することになる。このため、常に隣接する4画素分のデータを読み出して転送する方が、システムバス108の利用効率を高めることができる。図4では例として、ラインL0,ラインL4,ラインL8,ラインL12,ラインL16において、それぞれ12画素おきに隣接4画素を読み出してシーンチェンジ検出回路104に転送して、差分演算に利用している。
図5は、図4の画素位置例を適用した場合のCPU107によるDRAM105からの画像データ読み出し処理の流れを示すフローチャートである。なお、ここでは、1ピクチャの水平方向、垂直方向の画素数をそれぞれpx、py、隣接4画素の先頭から次に読み出す隣接4画素の先頭までの画素数をix、読み出しを行ったラインから次に読み出しを行うラインまでのライン数をi1yとする。
〔ステップS101〕アドレス算出のための変数x,yを初期化する。
〔ステップS102〕水平方向に隣接する4画素に対応する「buffer0」〜「buffer3」のアドレスをそれぞれ生成する。
〔ステップS103〕隣接4画素のうちの最初の画素(buffer0)のアドレス(x、y)をDRAM105に指定し、対応する画素のデータをシーンチェンジ検出回路104に転送させる。
〔ステップS104〕次に読み出す画素(buffer1)の水平方向アドレス(x+1)がpxより小さい場合はステップS105に進み、そうでない場合はステップS106に進む。
〔ステップS105〕次の画素(buffer1)のアドレスをDRAM105に指定し、対応する画素のデータをシーンチェンジ検出回路104に転送させる。
〔ステップS106〕次に読み出す画素(buffer2)の水平方向アドレス(x+2)がpxより小さい場合はステップS107に進み、そうでない場合はステップS108に進む。
〔ステップS107〕次の画素(buffer2)のアドレスをDRAM105に指定し、対応する画素のデータをシーンチェンジ検出回路104に転送させる。
〔ステップS108〕次に読み出す画素(buffer3)の水平方向アドレス(x+3)がpxより小さい場合はステップS109に進み、そうでない場合はステップS110に進む。
〔ステップS109〕次の画素(buffer3)のアドレスをDRAM105に指定し、対応する画素のデータをシーンチェンジ検出回路104に転送させる。
〔ステップS110〕変数xにixを加算する。
〔ステップS111〕変数xがpxより小さい場合はステップS102に戻り、ix分の画素を間引いた次の4画素の読み出し処理を続ける。また、変数xがpx以上である場合はステップS112に進む。
〔ステップS112〕変数xを0にし、変数yにi1yを加算して、読み出し対象のラインをily分だけ進める。
〔ステップS113〕変数yがpyより小さい場合はステップS102に戻り、新たなラインにおける隣接4画素の読み出し処理を続ける。また、変数yがpy以上である場合は、1ピクチャ分の読み出し処理を終了する。
ここで、図6に、シーンチェンジ検出に使用する総画素数が図4の例とほぼ同じ場合の使用画素位置の例を、参考のために示す。
図6では、図4の場合と同様に、ラインL0,ラインL4,ラインL8,ラインL12,ラインL16においてのみデータの読み出しを行っている。図4と異なる点は、上記各ラインで3画素おきに1画素分のデータだけを読み出していることである。
この図6では、読み出す総画素数は図4の場合と大きな差がないので、シーンチェンジの検出精度はほぼ同じである。しかし、1画素分ずつデータを読み出すため、その読み出し時にはバス幅32ビットのシステムバス108上に1バイトのデータしか転送されない。これに対して、図4の場合には4画素分ずつデータを読み出すことで、システムバス108上に転送能力の上限の4バイトのデータが転送され、図6の場合と比較してピクチャ全体での転送に要する時間を約1/4に短縮することができる。
従って、図4のようにバス幅に応じた画素数分だけ連続して読み出すことで、検出精度を低下させることなく、データ転送に要する時間を短縮することができる。あるいは、画像データの転送の間に、ビデオキャプチャ回路102からの画像データの取り込みや、ビデオエンコーダ106への画像データの送出等、他の用途のデータ転送を実行することが可能となる。従って、システムバス108のバス幅を高めて製造コストを増大させることなく、処理効率を向上させて処理能力を高めることができる。
なお、システムの冗長性を保つために、連続して読み出す画素数の総データ量が、バス幅よりわずかに低くなるように画素数を設定してもよい。
ところで、図4に示した例では、データの読み出しが行われるライン(ラインL0,ラインL4,ラインL8,ラインL12,ラインL16)において連続して読み出しを間引く最大の画素数dxよりも、全画素の読み出しが間引かれる連続したライン(例えばラインL1〜L3)の最大数dyを小さくしている。これにより、1ライン上の隣接複数画素の読み出し間隔を広げるとともに、ライン間の読み出し間隔が狭められ、読み出しが要求される時間間隔が平均的に広がって分散される。従って、システムバス108に短時間に大きな負荷がかかることが回避され、システムの破綻を防止することができる。
さらに、以下の図7の例のように、読み出しを行う隣接複数画素を割り当てる位置をラインごとに互い違いにすることで、ピクチャ上のシーンチェンジ検出位置が分散され、その検出精度を高めることができる。
図7は、シーンチェンジ検出に使用する画素位置の他の例を示す図である。
図7の例では、図4の場合と同様に、DRAM105から隣接する4画素ずつ読み出して、システムバス108の利用効率を高めている。また、読み出しが行われるライン上での連続した最大の間引き数dxを、垂直方向の最大間引きライン数dyより大きくして、システムの安定化を図っている。これに加えて、読み出しが行われるラインごとに、読み出し対象の隣接4画素を割り当てる位置を互い違いにしている。例えば、ラインL5における読み出し対象の隣接4画素は、ラインL0における間引き領域の中央部に位置している。
なお、この図7では、入力動画像信号としてインタレース方式のものを想定している。また、図7の各ラインには、偶数フィールドと奇数フィールドを合わせた1フレームでのライン番号(L0〜L19)を付している。
インタレース方式の場合、奇数フィールドから偶数フィールドに移行するときと、偶数フィールドから奇数フィールドに移行するときのどちらでも、シーンチェンジが発生し得る。このため、シーンチェンジの検出に使用する画素は、偶数フィールドおよび奇数フィールドの双方に割り当てておく必要がある。
図7ではこのことを考慮して、フレーム内の偶数ライン(L0,L8,L16)および奇数ライン(L5,L13)において隣接4画素のデータの読み出しを行うようにし、さらに読み出しを行う偶数ラインと奇数ラインとの間で読み出し位置を互い違いにしている。これにより、どんなタイミングでシーンチェンジが発生しても、確実に検出できるようになっている。
図8は、図7の画素位置例を適用した場合のCPU107によるDRAM105からの画像データ読み出し処理の流れを示すフローチャートである。なお、ここでは、図5で用いたpx,py,ixの他に、読み出しを行う偶数ライン間または奇数ライン間の間隔(ライン数)をi2yとする。
〔ステップS201〕アドレス算出のための変数x,yを初期化する。また、読み出し対象が偶数フィールドのラインであることを示すフラグである「even」に1を設定する。
〔ステップS202〜S211〕これらの処理ステップは、図5のステップS102〜S111にそれぞれ対応する。すなわち、アドレスに対応する読み出し対象画素の位置がラインの終端に達していなければ、そのアドレスをDRAM105に指定して画素のデータをシーンチェンジ検出回路104に転送させる。そして、ステップS210で変数xにixを加算した後、ステップS211で、変数xで示される水平方向のアドレスがラインの終端に達していなければ、ステップS202に戻って次の隣接4画素の読み出し処理を続行し、達していた場合はステップS212に進む。
〔ステップS212〕フラグ「even」が1である場合はステップS213に進み、0である場合はステップS214に進む。
〔ステップS213〕変数xにix/2を設定し、変数yに(i2y/2)+1を加算し、フラグ「even」に0を設定して、読み出し対象を奇数ラインに進め、ステップS215に進む。
〔ステップS214〕変数xに0を設定し、変数yに(i2y/2)−1を加算し、フラグ「even」に1を設定して、読み出し対象を偶数ラインに進め、ステップS215に進む。
〔ステップS215〕変数yがpyより小さい場合はステップS202に戻り、新たなラインにおける隣接4画素の読み出し処理を続ける。また、変数yがpy以上である場合は、1ピクチャ分の読み出し処理を終了する。
以上の処理により、システムバス108の利用効率が向上することに加えて、画像データの読み出しタイミングが分散して、システムバス108に対して負荷が集中する事態が回避されるので、システムに冗長性が生まれて動作が安定化する。これとともに、シーンチェンジの検出に用いられる画素の位置が、偶数フィールドおよび奇数フィールドの双方において同じように分散されるので、シーンチェンジの発生タイミングにかかわらず検出精度を向上させることができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、上記の画像処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等がある。磁気記録装置には、HDD、フレキシブルディスク(FD)、磁気テープ等がある。光ディスクには、DVD(Digital Versatile Disk)、DVD−R(Recordable)/RW(ReWritable)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R/RW等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
実施の形態に係る画像処理装置の動作の概要を示す図である。 実施の形態に係る画像処理装置の具体的な構成例を示す図である。 シーンチェンジ検出回路の構成例を示す図である。 シーンチェンジ検出に使用する画素位置の例を示す図である。 図4の画素位置例を適用した場合のCPUによるDRAMからの画像データ読み出し処理の流れを示すフローチャートである。 シーンチェンジ検出に使用する総画素数が図4の例と同じ場合の使用画素位置の例を、参考のために示した図である。 シーンチェンジ検出に使用する画素位置の他の例を示す図である。 図7の画素位置例を適用した場合のCPUによるDRAMからの画像データ読み出し処理の流れを示すフローチャートである。 シーンチェンジ検出回路を含むMPEG符号化のための従来の回路構成を概略的に示す図である。
符号の説明
11 シーンチェンジ検出部
12 記憶装置
13 データバス
14 転送制御部
21,22 ピクチャ
101 チューナ回路
102 ビデオキャプチャ回路
103 転送エンジン回路
104 シーンチェンジ検出回路
105 DRAM
106 ビデオエンコーダ
107 CPU
108 システムバス

Claims (8)

  1. 入力動画像データを基にシーンチェンジを検出する画像処理装置において、
    検出対象のピクチャのデータとその直前のピクチャのデータとを画素を間引いて受信し、前記検出対象および前記直前の各ピクチャ間のデータの差分値を基にシーンチェンジを検出するシーンチェンジ検出部と、
    少なくとも前記直前のピクチャについて、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置から連続的に読み出すとともに、前記記憶装置から前記画素群間の間隔を空けてデータを読み出し、データバスを通じて前記シーンチェンジ検出部に転送するように制御し、前記画素群に含まれる画素数を、バス幅に応じて決定される前記データバスでの転送可能な最大数、またはその整数倍の数とした転送制御部と、
    を有することを特徴とする画像処理装置。
  2. 前記転送制御部は、ピクチャ内で前記画素群が割り当てられた水平方向の1ライン上において連続して読み出しが間引かれる最大画素数より、1ライン上の全画素の読み出しが間引かれる連続したラインの最大数が小さくなるように、前記記憶装置からの読み出しを制御することを特徴とする請求項1記載の画像処理装置。
  3. 前記転送制御部は、前記画素群が割り当てられた複数のラインの間で、前記画素群の水平方向の位置が互い違いになるように、前記記憶装置からの読み出しを制御することを特徴とする請求項2記載の画像処理装置。
  4. インタレース方式の動画像データが入力される場合に、
    前記転送制御部は、1フレーム中の偶数ラインおよび奇数ラインの双方に前記画素群を割り当てて前記記憶装置から読み出すように制御することを特徴とする請求項1記載の画像処理装置。
  5. 入力動画像データを基にシーンチェンジを検出するための画像処理方法において、
    転送制御部が、検出対象のピクチャおよびその直前のピクチャのうち、少なくとも前記直前のピクチャについて、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置から連続的に読み出すとともに、前記記憶装置から前記画素群間の間隔を空けてデータを読み出し、データバスを通じて検出処理部に転送するように制御し、前記画素群に含まれる画素数を、バス幅に応じて決定される前記データバスでの転送可能な最大数、またはその整数倍の数としたデータ転送ステップと、
    前記検出処理部が、前記データバスを通じて受信した前記検出対象および前記直前の各ピクチャのデータの差分値を演算し、その演算結果を基にシーンチェンジを検出する検出処理ステップと、
    を含むことを特徴とする画像処理方法。
  6. 前記データ転送ステップでは、前記転送制御部が、ピクチャ内で前記画素群が割り当てられた水平方向の1ライン上において連続して読み出しが間引かれる最大画素数より、1ライン上の全画素の読み出しが間引かれる連続したラインの最大数が小さくなるように、前記記憶装置からの読み出しを制御することを特徴とする請求項5記載の画像処理方法。
  7. 前記データ転送ステップでは、前記転送制御部が、前記画素群が割り当てられた複数のラインの間で、前記画素群の水平方向の位置が互い違いになるように、前記記憶装置からの読み出しを制御することを特徴とする請求項6記載の画像処理方法。
  8. 入力動画像データを基にシーンチェンジを検出するための処理をコンピュータに実行させる画像処理プログラムにおいて、
    検出対象のピクチャのデータとその直前のピクチャのデータとを画素を間引いて受信し、前記検出対象および前記直前の各ピクチャ間のデータの差分値を基にシーンチェンジを検出するシーンチェンジ検出部、
    少なくとも前記直前のピクチャについて、ピクチャ内の水平方向に隣接する一定数の画素からなる画素群のデータを記憶装置から連続的に読み出すとともに、前記画素群間の間隔を空けて前記記憶装置からデータを読み出し、データバスを通じて前記シーンチェンジ検出部に転送するように制御し、前記画素群に含まれる画素数を、バス幅に応じて決定される前記データバスでの転送可能な最大数、またはその整数倍の数とした転送制御部、
    として前記コンピュータを機能させることを特徴とする画像処理プログラム。
JP2004368967A 2004-12-21 2004-12-21 画像処理装置および方法 Expired - Fee Related JP4420811B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004368967A JP4420811B2 (ja) 2004-12-21 2004-12-21 画像処理装置および方法
US11/089,359 US7542609B2 (en) 2004-12-21 2005-03-25 Device and method for image processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004368967A JP4420811B2 (ja) 2004-12-21 2004-12-21 画像処理装置および方法

Publications (2)

Publication Number Publication Date
JP2006180020A JP2006180020A (ja) 2006-07-06
JP4420811B2 true JP4420811B2 (ja) 2010-02-24

Family

ID=36595816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004368967A Expired - Fee Related JP4420811B2 (ja) 2004-12-21 2004-12-21 画像処理装置および方法

Country Status (2)

Country Link
US (1) US7542609B2 (ja)
JP (1) JP4420811B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9866785B2 (en) * 2007-08-15 2018-01-09 Advanced Micro Devices, Inc. Automatic reduction of video display device power consumption
GB2467075B (en) * 2007-11-14 2012-07-04 Ambx Uk Ltd Pause/stop detection
US10574995B2 (en) 2017-04-10 2020-02-25 Intel Corporation Technology to accelerate scene change detection and achieve adaptive content display

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330344B1 (en) * 1997-02-14 2001-12-11 Sony Corporation Image processing device and method employing motion detection to generate improved quality image from low resolution image
JP2001313831A (ja) * 1999-11-05 2001-11-09 Ricoh Co Ltd 画像処理装置、画像処理方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7054367B2 (en) * 2001-12-31 2006-05-30 Emc Corporation Edge detection based on variable-length codes of block coded video

Also Published As

Publication number Publication date
US7542609B2 (en) 2009-06-02
US20060133676A1 (en) 2006-06-22
JP2006180020A (ja) 2006-07-06

Similar Documents

Publication Publication Date Title
US7272183B2 (en) Image processing device, method and storage medium thereof
US7706445B2 (en) Image processing employing picture type conversion
US20080279280A1 (en) Moving picture decoding integrated circuit
JPH0374982A (ja) 画像信号の伝送装置および伝送方法
US7245821B2 (en) Image processing using shared frame memory
JP4440863B2 (ja) 符号化復号化装置、符号化復号化方法、符号化復号化集積回路、および符号化復号化プログラム
JP2010124038A (ja) 映像変換装置、映像再生装置、映像変換再生システム及びプログラム
US7305171B2 (en) Apparatus for recording and/or reproducing digital data, such as audio/video (A/V) data, and control method thereof
US20030099293A1 (en) Image reproducing method, and image processing method, and image reproducing device, image processing device, and television receiver capable of using the methods
JP3827705B1 (ja) 映像記録装置及びシーンチェンジ抽出方法
US7542609B2 (en) Device and method for image processing
JP3253530B2 (ja) 動画像記録装置
JP3669963B2 (ja) テレビにおける貯蔵媒体を用いた放送信号検索装置及び方法
EP1259073A1 (en) Image reproducing method and image processing method, and image reproducing device, image processing device, and television receiver capable of using the methods
JP4191385B2 (ja) Mpeg符号化信号のトリックプレイ再生
US6788877B1 (en) Recording and reproducing apparatus
JP3394102B2 (ja) 光ディスクの再生方法及び再生装置
JPH1084545A (ja) ディジタルビデオ信号の符号化方法及び装置
JP2007158778A (ja) トリック再生用コンテンツ作成方法および装置、トリック再生用圧縮動画データ送出方法および装置、およびトリック再生用コンテンツ作成用プログラム
JP3304634B2 (ja) ディジタル信号再生装置
JP3511312B2 (ja) 光ディスク、および光ディスクの再生装置および方法
US8149679B2 (en) Recording/reproducing device and method, recording medium, and program
JP2001275087A (ja) 記録再生装置
JP2002176622A (ja) 映像信号の記録方法、及び映像信号記録装置
JP2001283525A (ja) 画像記録再生方法および画像記録再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071016

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees