JP2012178818A - 映像符号化装置および映像符号化方法 - Google Patents

映像符号化装置および映像符号化方法 Download PDF

Info

Publication number
JP2012178818A
JP2012178818A JP2011251138A JP2011251138A JP2012178818A JP 2012178818 A JP2012178818 A JP 2012178818A JP 2011251138 A JP2011251138 A JP 2011251138A JP 2011251138 A JP2011251138 A JP 2011251138A JP 2012178818 A JP2012178818 A JP 2012178818A
Authority
JP
Japan
Prior art keywords
video
encoding
upper limit
limit value
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011251138A
Other languages
English (en)
Inventor
Yuki Maruyama
悠樹 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2011251138A priority Critical patent/JP2012178818A/ja
Priority to US13/358,578 priority patent/US20120194643A1/en
Publication of JP2012178818A publication Critical patent/JP2012178818A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

【課題】3D映像として入力映像を符号化する際、立体視しやすい符号化映像を生成することができる映像符号化装置を提供する。
【解決手段】映像符号化装置103であって、入力映像が3D映像であるか、2D映像であるかを判断する3D映像検出部104と、3D映像検出部104の判断結果に基づいて、符号化時に用いる量子化幅の上限値を設定する符号化パラメータ設定部105と、符号化パラメータ設定部105で設定された上限値以下の量子化幅で入力映像を符号化する符号化部106とを備え、符号化パラメータ設定部105は、3D映像検出部104によって入力映像が3D映像であると判断された場合に、3D映像に対する量子化幅の上限値を、2D映像に対する量子化幅の上限値と異なる値に設定する。
【選択図】図1

Description

本発明は、3D映像または2D映像を圧縮符号化して光ディスク、磁気ディスクあるいはフラッシュメモリ等の記憶メディア上に記録する映像符号化装置および映像符号化方法に関する。
デジタル映像技術の発展と共に、データ量の増大に対応してデジタル映像データを圧縮符号化する技術が発展しつつある。その発展は、映像データの特性を生かし、映像データに特化した圧縮符号化技術となって現れている。
H.264圧縮符号化は、光ディスクの1つの規格であるBlu−ray(登録商標。以下、BDと称す)および、ハイビジョン映像をビデオカメラで記録するための規格であるAVCHD(登録商標。Advanced Video Codec High Definition)の動画圧縮方式としても採用されており、幅広い分野での利用が期待されている。
一般に、動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動き量(以下、動きベクトルと称す)を検出し、検出した動きベクトルを考慮した予測(以下、動き補償と称す)を行う。
そして、当該画面間予測符号化では、この動き補償を行うことによって予測精度を上げ、符号化効率を向上させている。例えば、当該画面間予測符号化では、符号化対象となる入力映像の動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号化対象となる入力映像との予測残差を符号化することにより、符号化に必要な情報量を削減している。
なお、ここで、動きベクトルの検出時に参照されるピクチャを参照ピクチャと呼ぶ。また、ピクチャとは1枚の画面を表す用語である。動きベクトルはブロック単位で検出されており、具体的には、符号化対象ピクチャ側のブロック(以下、符号化対象ブロックと称す)を固定しておき、参照ピクチャ側のブロック(以下、参照ブロックと称す)を探索範囲内で移動させる。
その結果、符号化対象ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。この動きベクトルを探索する処理を動きベクトル検出と呼ぶ。似通っているかどうかの判断としては、符号化対象ブロックと参照ブロックとの比較誤差を使用する。例えば、比較誤差として絶対値差分和(SAD:Summed Absolute Difference)がよく用いられる。
なお、参照ピクチャ全体の中で参照ブロックを探索すると演算量が膨大となるため、参照ピクチャの中で探索する範囲を制限することが一般的であり、制限した範囲を探索範囲と呼ぶ。
画面間予測符号化を行わず、空間的な冗長性の削減を目的とした画面内予測符号化のみを行うピクチャを、Iピクチャと呼ぶ。また、1枚の参照ピクチャから画面間予測符号化を行うものを、Pピクチャと呼ぶ。また、最大2枚の参照ピクチャから画面間予測符号化を行うものを、Bピクチャと呼ぶ。
一方、3D映像を符号化する方式として、様々な方式が提案されている(例えば、非特許文献1参照)。ここで、第1視点の映像信号(以下、第1視点映像と称す)と、当該第1視点とは異なる第2視点の映像信号(以下、第2視点映像と称す)で構成された映像信号を3D映像と称す。
なお、第1視点映像と第2視点映像とは、いずれか一方が右目用の映像で、もう一方が左目用の映像である。また、第1視点の映像信号のみで構成された映像信号を2D映像と称す。
3D映像を符号化する方式の一例としては、第1視点映像については、2D映像と同様の方式で符号化し、第2視点映像については、同時刻の第1視点映像のピクチャを参照ピクチャとして動き補償を行う方式が提案されている(以下、視差補償方式と称す)。
この方式は、後述するサイド・バイ・サイド方式と比べて、第1視点映像と第2視点映像の解像度を下げることなく符号化できるというメリットがある一方、画素情報量が2倍になるため、圧縮したときの符号量が増えてしまうというデメリットがある。
また、その他の一例としては、第1視点映像と第2視点映像とをそれぞれ水平方向に1/2に縮小し、縮小した映像信号を左右に並べ、2D映像と同様の方式で符号化する方式が提案されている(以下、サイド・バイ・サイド方式と称す)。
この方式は、2D映像と同様の方式で符号化できるため、新たな符号化装置を用意する必要ないというメリットがある一方で、第1視点映像と第2視点映像の解像度が水平方向で1/2に低下するため、視聴時の臨場感が低下するというデメリットがある。
「立体ハイビジョン撮像における左右画像間の幾何学的ひずみの検知限・許容限の検討」(NHK)電子情報通信学会論文誌Vol.J80−D−II No.9 pp.2522−2531(1997)
左右の映像間で垂直のずれや、傾きのずれ、あるいは大きさのずれといった、両眼で知覚する情報に大きな差異がある3D映像を視聴すると、認知的な矛盾が生じ、眼精疲労または映像酔いの原因となることが知られている(非特許文献1参照)。
圧縮符号化により圧縮歪みを伴った3D映像を視聴する場合、ブロックノイズやモスキートノイズなどの符号化歪みの表れ方が左右の映像で異なる。このため、認知的な矛盾が生じ、圧縮歪みのない映像よりも、立体視しづらいという課題が発生すると考えられる。
BDレコーダやAVCHDムービーでは、記録レートの異なる複数の記録モードが用意されていることが多く、記録時間と画質がトレードオフの関係になっている。しかし、記録レートの低い記録モードで記録する場合、量子化幅が高くなるシーンが多くなる。このため、3D映像を記録する場合は、記録レートが高い記録モードで記録した場合に比べて、画質が劣化するだけでなく、眼精疲労または映像酔いを発症しやすくなるといった課題があった。
本発明は、かかる課題を解決するためになされたものであり、3D映像として入力映像を符号化する際、立体視しやすい符号化映像を生成することができる映像符号化装置および映像符号化方法を提供することを目的とする。
上記の目的を達成するため、本発明の一態様に係る映像符号化装置は、入力映像を符号化する映像符号化装置であって、前記入力映像が3D映像であるか、2D映像であるかを判断する判断部と、前記判断部の判断結果に基づいて、符号化時に用いる量子化幅の上限値を設定する設定部と、前記設定した上限値以下の量子化幅で、前記入力映像を符号化する符号化部と、を備え、前記設定部は、前記判断部によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値と異なる値に設定する。
このようにすれば、2D映像を符号化する際に適用される量子化幅の上限値と、3D映像を符号化する際に適用される量子化幅の上限値とを異なるものに設定することができる。これにより、映像符号化装置は、2D映像および3D映像の視聴特性に応じて、符号化条件を設定することが出来るため、2D映像および3D映像のそれぞれの映像特性に応じて符号化することが可能となる。したがって、映像符号化装置は、3D映像として入力映像を符号化する際、立体視しやすい符号化映像を生成することができる。
また好ましくは、前記設定部は、前記判断部によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値よりも小さい値に設定する。
このようにすれば、映像符号化装置は、2D映像を符号化するよりも3D映像を符号化するほうが、映像の圧縮歪みを低減することができる。これにより、例えば視聴者が3D映像を視聴する際にわざわざ符号化レートを変更せずとも、映像符号化装置は、3D映像として入力映像を符号化する際、自動的に2D映像よりも圧縮歪みを少なくすることができ、立体視しやすい符号化映像を生成することができる。
また好ましくは、前記設定部は、前記入力映像のピクチャタイプ毎に、異なる量子化幅の上限値を設定する。
このようにすれば、例えば、Iピクチャは、他のピクチャタイプに比べて量子化幅の上限値を高く設定することが出来る。これにより、映像符号化装置は、ピクチャタイプの映像品位に応じて、符号化条件を設定することが出来るため、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
また好ましくは、前記符号化部が前記入力映像の入力信号をインターレース信号として符号化する場合、前記設定部は、前記入力映像のフィールド毎に、異なる量子化幅の上限値を設定する。
このようにすれば、映像符号化装置は、フィールド毎の映像特性に応じて、符号化条件を設定することが出来るため、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
また好ましくは、前記設定部は、前記量子化幅に関連する情報である量子化マトリクスおよび量子化パラメータのうち、少なくとも一方の情報に対して、上限値を設定することで、前記量子化幅の上限値を設定する。
このようにすれば、映像符号化装置は、量子化マトリクスまたは量子化パラメータについて上限値を設定して量子化幅の上限値を設定することにより、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
なお、本発明は、このような映像符号化装置として実現することができるだけでなく、上記の映像符号化装置に含まれる各処理部を備える集積回路として実現することもできる。また、本発明は、当該処理部が行う特徴的な処理を含む映像符号化方法として実現することもできる。
また、本発明は、映像符号化方法に含まれる特徴的な処理をコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体及びインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
本発明によれば、入力映像が3D映像であるか、2D映像であるかを判断して、符号化する際に使用する量子化幅を制御する方式を決定するため、3D映像として入力映像を符号化する際、立体視しやすい符号化映像を生成することができる。
本実施の形態に係るビデオカメラの構成を示すブロック図 本実施の形態に係るビデオカメラにおける符号化部の詳細な構成を示すブロック図 本実施の形態に係るビデオカメラが実行する処理の一例を示すフローチャート 本実施の形態の変形例に係る符号化パラメータ設定部および符号化部が実行する処理の一例を示すフローチャート
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示すものである。以下の実施の形態で示される数値、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。本発明は、特許請求の範囲だけによって限定される。よって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、本発明の課題を達成するのに必ずしも必要ではないが、より好ましい形態を構成するものとして説明される。
(実施の形態)
本発明は、例えばビデオカメラといった、映像撮影装置が備える映像符号化装置として実現することができる。本実施の形態では、映像符号化装置を搭載したビデオカメラが実行する処理について説明する。
図1は、本実施の形態に係るビデオカメラ100の構成を示すブロック図である。本実施の形態に係るビデオカメラ100においては、3D映像または2D映像が入力映像として入力され、H.264圧縮方式で符号化されたストリームとして記録される。
H.264圧縮方式による符号化においては、1つのピクチャを1つまたは複数のスライスに分割し、そのスライスを処理単位としている。本実施の形態におけるH.264圧縮方式による符号化では、1つのピクチャが1つのスライスであるとする。
図1において、ビデオカメラ100は、制御部101と、撮像部102と、映像符号化装置103と、記録部107とを備える。また、映像符号化装置103は、3D映像検出部104と、符号化パラメータ設定部105と、符号化部106とを備える。
制御部101は、ビデオカメラ100全体の動作を制御する。制御とは、例えば、撮影を開始するかまたは終了するか、3D撮影モードで撮影するかまたは2D撮影モードで撮影するか(以下、撮影モード情報と称す)、ISO感度制御、ズーム制御、記録レートをいくらにするか、といったビデオカメラ100全体の動作の制御をいう。制御部101は、これらの制御についての情報(以下、制御情報と称す)を、撮像部102と、3D映像検出部104と、符号化部106とに出力する。
撮像部102は、制御部101から出力された制御情報に基づいて、光学像を形成して撮像し、デジタル信号として入力映像を取得する。具体的に、撮像部102は、立体視用の映像を生成する。
この立体視用の映像は、少なくとも第1視点において形成された光学像から生成される第1視点映像、および、第2視点において形成された光学像から生成される第2視点映像から構成される。使用者は、第1視点映像および第2視点映像を特定の表示方法で視聴すると、当該第1視点映像および当該第2視点映像を立体映像として視聴することができる。
本実施の形態においては、撮像部102は、3D映像を撮影した場合、第1視点映像と第2視点映像とを生成し、符号化部106および3D映像検出部104に出力するものとする。また、撮像部102は、2D映像を撮影した場合、第1視点映像のみを生成し、符号化部106および3D映像検出部104に出力するものとする。
3D映像検出部104は、制御部101から出力された撮影モード情報に基づいて、入力映像が3D映像であるか、2D映像であるかを判断する判断部である。そして、3D映像検出部104は、判断結果を検出情報として符号化パラメータ設定部105に出力する。
符号化パラメータ設定部105は、3D映像検出部104から出力された検出情報に基づいて、符号化する際に使用する量子化幅の上限値を設定する設定部である。つまり、符号化パラメータ設定部105は、3D映像検出部104によって入力映像が3D映像であると判断された場合、3D映像に対する量子化幅の上限値を、2D映像に対する量子化幅の上限値と異なる値に設定する。
具体的には、符号化パラメータ設定部105は、検出情報に基づいて入力映像が3D映像であると判断する場合、予め定めた第1の上限値(以下、第1上限値と称す)をTH_QPに設定する。一方、符号化パラメータ設定部105は、検出情報に基づいて入力映像が2D映像であると判断する場合、予め定めた第2の上限値(以下、第2上限値と称す)をTH_QPに設定する。
ここで、第1上限値は第2上限値よりも小さく設定される。つまり、符号化パラメータ設定部105は、3D映像検出部104によって入力映像が3D映像であると判断された場合に、3D映像に対する量子化幅の上限値を、2D映像に対する量子化幅の上限値よりも小さい値に設定する。
また、第1上限値は予め設定される値であるが、符号化部106からの出力結果に基づいて動的に変わる値であっても構わない。また、第2上限値は、例えば、H.264圧縮符号化方式で取り得る量子化幅の最大値である。なお、第2上限値は上記の値に限定されるものではなく、第1上限値よりも大きい値であればどのような値を用いても構わない。
なお、H.264圧縮符号化方式では、量子化マトリクスと、Qというパラメータ(量子化パラメータ)とから量子化幅を決定している。このため、符号化パラメータ設定部105は、量子化幅に関連する情報である量子化マトリクスおよび量子化パラメータQのうち、少なくとも一方の情報に対して、上限値を設定することで、量子化幅の上限値を設定することにしてもよい。
具体的には、符号化パラメータ設定部105は、量子化幅の上限値を、量子化マトリクスとQの両方の上限値を設定することで求めてもよい。また、符号化パラメータ設定部105は、量子化マトリクスのみ上限値を設定し、例えば、量子化マトリクスの係数が一定以上にならないようにすることで量子化幅の上限値を設定してもよい。また、符号化パラメータ設定部105は、Qのみ上限値を設定し、例えば、Qが一定値以上にならないようすることで量子化幅の上限値を設定してもよい。
また、Qは符号化対象ブロック毎に設定可能であるが、制御を簡易にするために、符号化パラメータ設定部105は、スライス単位で挿入されるヘッダ情報に記載されているQ値が一定値以上にならないように上限値を設定してもよい。具体的には、符号化パラメータ設定部105は、H.264圧縮符号化方式におけるスライスヘッダのslice_qp_deltaというパラメータが一定値以上にならないように上限値を設定する。
さらには、符号化パラメータ設定部105は、入力映像のピクチャタイプ毎に、異なる量子化幅の上限値を設定することにしてもよい。具体的には、符号化パラメータ設定部105は、Iピクチャ、Pピクチャ、Bピクチャといったピクチャタイプ毎に上限値を変更してもよい。
また、符号化部106が入力映像の入力信号をインターレース信号として符号化する場合には、符号化パラメータ設定部105は、入力映像のフィールド毎に、異なる量子化幅の上限値を設定することにしてもよい。つまり、符号化パラメータ設定部105は、入力映像がインターレース信号である場合は、トップフィールドとボトムフィールドとで上限値を変更してもよい。
また、符号化パラメータ設定部105は、数秒単位または映像シーン単位(以下、基準単位と称す)で基準となる量子化幅の基準パラメータを設定し、当該基準パラメータに基づいて基準単位内の各符号化単位における量子化幅を設定するレート制御を行なう場合、当該基準パラメータが一定値以上にならないように上限値を設定してもよい。
また、符号化パラメータ設定部105は、第1視点映像と、第2視点映像とを符号化するときのそれぞれの量子化幅の上限値を変えてもよい。
また、符号化パラメータ設定部105は、記録レートから求められる目標発生符号量に対して、出力ストリームの発生符号量がどれだけ乖離しているかに応じて、上限値を変更してもよい。具体的には、符号化パラメータ設定部105は、符号化した出力ストリームの発生符号量が、記録レートから求められる目標発生符号量より多い場合は、上限値を大きくし、少ない場合は、上限値を小さく設定する。
また、符号化パラメータ設定部105は、復号用のバッファであるDPB(デコードピクチャバッファ)の残量から求まる量子化幅の上限値(以下、第3上限値と称す)が、設定した量子化幅の上限値よりも大きい場合は、当該第3上限値を優先させるように、量子化幅の上限値を再設定することにしてもよい。つまり、この場合、符号化パラメータ設定部105は、当該第3上限値を、量子化幅の上限値として再設定する。
また、符号化パラメータ設定部105は、設定した量子化幅の上限値における記録レートでの累積符号量が、目標とする記録レート(ターゲットレート)での累積符号量から乖離し続ける場合、記録レートをターゲットレートに近づけるように、量子化幅の上限値を上昇させることにしてもよい。
符号化部106は、符号化パラメータ設定部105が設定した上限値以下の量子化幅で、入力映像を符号化する。具体的には、符号化部106は、制御部101から出力された記録レートと、符号化パラメータ設定部105が出力した量子化幅の上限値に従って、撮像部102が出力した入力映像を、H.264圧縮方式により圧縮符号化する。
なお、符号化部106が利用する符号化方式は、上記の方式に限定されるものではなく、次世代画像符号化標準規格であるHEVC(High Efficiency Video Coding)規格など、量子化幅を利用する符号化方式であればどのようなものを利用しても構わない。
記録部107は、符号化部106が出力した出力ストリームを内部メモリ等に記録し、保持する。
次に、図2を用いて、符号化部106の詳細な構成について説明する。なお、図2は、本実施の形態に係るビデオカメラ100における符号化部106の詳細な構成を示すブロック図である。
図2において、符号化部106は、入力映像データメモリ201、参照画像データメモリ202、面内予測部203、動きベクトル検出部204、動き補償部205、予測モード判定部206、差分演算部207、直交変換部208、量子化部209、逆量子化部210、逆直交変換部211、加算部212、エントロピー符号化部213、およびレート制御部214を備えている。
入力映像データメモリ201は、撮像部102から入力される映像を格納する。例えば、撮像部102から第1視点映像および第2視点映像が入力される場合、入力映像データメモリ201は、第1視点映像信号および第2視点映像信号の2つの信号を格納する。なお、入力映像データメモリ201が保持している信号は、面内予測部203、動きベクトル検出部204、動き補償部205、予測モード判定部206、および差分演算部207により参照される。
参照画像データメモリ202は、加算部212から入力されるローカルデコード画像を格納する。
面内予測部203は、参照画像データメモリ202に格納されているローカルデコード画像から同一画面内の符号化後の画素を用いて面内予測を行い、面内予測の予測画像を生成する。そして、面内予測部203は、生成した予測画像を、予測モード判定部206に出力する。
動きベクトル検出部204は、参照画像データメモリ202に格納されているローカルデコード画像を探索対象とし、最も入力映像に近い画像領域を検出して、その位置を示す動きベクトルを決定する。そして、動きベクトル検出部204は、最も誤差の小さい符号化対象ブロックのサイズおよびそのサイズでの動きベクトルを決定し、決定したそれらの情報を、動き補償部205およびエントロピー符号化部213に送信する。
動き補償部205は、動きベクトル検出部204から出力された情報に含まれる動きベクトルにしたがって、参照画像データメモリ202に格納されているローカルデコード画像から、予測画像に最適な画像領域を取り出す。そして、動き補償部205は、面間予測の予測画像を生成し、生成した予測画像を予測モード判定部206に出力する。
予測モード判定部206は、予測モードを判定して、その判定結果に基づき、面内予測部203からの面内予測で生成された予測画像と、動き補償部205からの面間予測で生成された予測画像とを切り替えて出力する。予測モード判定部206において予測モードを判定する方法としては、例えば、面間予測と面内予測について、それぞれ入力映像と予測画像との各画素の差分絶対値和を求め、この値が小さい方を予測モードと判定する。
差分演算部207は、入力映像データメモリ201から、符号化対象となる画像データを取得する。そして、差分演算部207は、取得した入力映像と予測モード判定部206から出力された予測画像との画素差分値を計算し、計算した画素差分値を直交変換部208に出力する。
直交変換部208は、差分演算部207から入力された画素差分値を周波数係数に変換し、変換した周波数係数を量子化部209に出力する。
量子化部209は、レート制御部214から入力された量子化幅に基づいて、直交変換部208から入力された周波数係数を量子化する。そして、量子化部209は、量子化した値、すなわち量子化値を符号化データとして、エントロピー符号化部213および逆量子化部210に出力する。
逆量子化部210は、量子化部209から入力された量子化値を逆量子化して周波数係数に復元し、復元した周波数係数を逆直交変換部211に出力する。
逆直交変換部211は、逆量子化部210から入力された周波数係数を画素差分値に逆周波数変換し、逆周波数変換した画素差分値を加算部212に出力する。
加算部212は、逆直交変換部211から入力される画素差分値と、予測モード判定部206から入力される予測画像とを加算してローカルデコード画像とし、そのローカルデコード画像を参照画像データメモリ202に出力する。
ここで、参照画像データメモリ202に記憶されるローカルデコード画像は、入力映像データメモリ201に記憶される入力映像と基本的には同じ画像であるが、直交変換部208および量子化部209などで一旦直交変換および量子化処理がされた後、逆量子化部210および逆直交変換部211などで逆量子化および逆直交変換処理がされるため、量子化歪みなどの歪み成分を有している。
エントロピー符号化部213は、量子化部209から入力された量子化値および動きベクトル検出部204から入力された動きベクトル等をエントロピー符号化し、その符号化したデータを出力ストリームとして出力する。
レート制御部214は、エントロピー符号化部213が出力した出力ストリームの符号量を監視し、出力ストリームのビットレートが制御部101から出力された記録レートに近づくように量子化幅を設定する。
さらに、レート制御部214は、符号化パラメータ設定部105が出力した量子化幅の上限値に従って、量子化幅の補正処理を行い、量子化部209に出力する。
例えば、出力ストリームのビットレートが記録レートに近づくように算出した量子化幅をQP、符号化パラメータ設定部105が出力した量子化幅の上限値をTH_QPとする。この場合、レート制御部214は、QPがTH_QP以上の場合、QPに代えてTH_QPまたはTH_QPよりも小さい量子化幅を新たな量子化幅として設定する。逆に、レート制御部214は、QPがTH_QPより小さい場合、そのままQPを量子化幅に設定する。
なお、レート制御部214がエントロピー符号化部213の出力結果に基づいて、レート制御を行なう構成を説明したが、レート制御部214が量子化部209の出力結果に基づいてレート制御を行なう構成でも構わない。
次に、以上のように構成されたビデオカメラ100が実行する処理について、説明する。
図3は、本実施の形態に係るビデオカメラ100が実行する処理の一例を示すフローチャートである。
まず、制御部101は、撮影を開始するよう制御する情報を撮像部102に出力する(S301)。撮影を開始するかまたは終了するかを、ユーザが制御する具体的な方法は、例えば、ビデオカメラの筐体に撮影開始および撮影終了ボタンを設け、ユーザが当該ボタンを操作することにより、撮影を開始するかまたは終了するかを制御する方法がある。
次に、撮像部102は、制御部101から撮影を開始するよう制御する情報を受け取ると、光学像を形成して、撮像し、デジタル信号として入力映像を取得する(S302)。そして、デジタル信号として取得された入力映像は、符号化部106の入力映像データメモリ201に格納される。
なお、3D撮影モードで撮影する場合、撮像部102は、第1視点映像と第2視点映像の両方をデジタル信号として取得する。また、2D撮影モードで撮影する場合、撮像部102は、第1視点映像のみをデジタル信号として取得する。
入力映像は、2D撮影モードで撮影する場合、例えば、1920画素×1080画素によって構成されている。また、3D撮影モードで撮影する場合、視差補償方式を用いて記録する場合は、例えば、第1視点映像と第2視点映像のそれぞれが1920画素×1080画素によって構成される。また、サイド・バイ・サイド方式で記録する場合は、例えば、第1視点映像と第2視点映像とをそれぞれ水平方向に1/2に縮小した、960画素×1080画素の画像データを左右に並べ、1920画素×1080画素とし、2D映像と同様の画像データとして扱う。
次に、3D映像検出部104は、制御部101から出力された撮影モード情報に基づいて、入力映像が3D映像であるか、2D映像であるかを判断する(S303)。そして、3D映像検出部104は、判断結果を検出情報として符号化パラメータ設定部105に出力する。より具体的には、3D映像検出部104は、撮影モードが3D撮影モードである場合、3D映像であると判断し、撮影モードが2D撮影モードである場合、2D映像であると判断する。
次に、符号化パラメータ設定部105は、3D映像検出部104から出力された検出情報に基づいて、符号化する際に使用する量子化幅の上限値TH_QPを設定する(S304)。具体的には、符号化パラメータ設定部105は、検出情報に基づいて入力映像が3D映像であると判断する場合、予め定めた第1上限値をTH_QPとして設定する。一方、符号化パラメータ設定部105は、検出情報に基づいて入力映像が2D映像であると判断する場合、予め定めた第2上限値をTH_QPに設定する。
次に、符号化部106は、制御部101から出力された記録レートと、符号化パラメータ設定部105が出力した量子化幅の上限値TH_QPとにしたがって、入力映像を符号化する(S305)。具体的には、符号化部106は、動きベクトル検出、動き補償、面内予測、直交変換、量子化およびエントロピー符号化、レート制御等の一連の符号化処理を実行する。本実施の形態においては、符号化部106は、H.264符号化方式にしたがって入力映像を符号化するものとする。
そして、記録部107は、符号化部106が出力した出力ストリームを、内部メモリ等に記録し、保持する(S306)。内部メモリは、ハードディスク、フラッシュメモリなどで実現される。さらには、SDカードスロットをビデオカメラ100に具備し、SDカードを着脱可能な構成にした上で、SDカードに出力ストリームを記録し保持してもよい。
(実施の形態の変形例)
次に、図4を用いて、符号化パラメータ設定部105および符号化部106が実行する他の処理例について、説明する。
図4は、本実施の形態の変形例に係る符号化パラメータ設定部105および符号化部106が実行する処理の一例を示すフローチャートである。
まず、符号化パラメータ設定部105は、3D映像検出部104から入力された検出情報に基づいて、入力映像が2D映像であるか、3D映像であるかを判断する(S401)。入力映像が2D映像である場合、符号化パラメータ設定部105は第2上限値を設定し、S405に移行する。一方、入力映像が3D映像である場合、符号化パラメータ設定部105は第1上限値を設定し、S402に移行する。
次に、符号化パラメータ設定部105が入力映像が3D映像であると判断した場合(S401でYes)、レート制御部214は、設定した量子化幅が符号化パラメータ設定部105から入力される第1上限値以上か否かを判断する(S402)。もし、設定した量子化幅が第1上限値以上である場合、S403に移行する。一方、設定した量子化幅が第1上限値よりも小さい場合、S404に移行する。
そして、設定した量子化幅が第1上限値以上であると判断された場合(S402でYes)、符号化部106は、入力映像を視聴時に2D映像として視聴されるように、当該入力映像を符号化するように動作を切り替える(S403)。
ここで、2D映像として視聴されるように入力映像を符号化する方法としては、入力映像のうち第1視点映像の符号化結果を第2視点映像にそのままコピーする方法や、第2視点映像の符号化結果として第1視点映像を符号化した結果を参照するスキップマクロブロックを利用する方法等がある。要するに、第1視点映像と第2視点映像とを視聴した際、立体的に視聴できないようにする方法であればどのような方法を利用しても構わない。
また、設定した量子化幅が第1上限値よりも小さいと判断した場合は(S402でNo)、符号化部106は、符号化パラメータ設定部105が設定した第1上限値に基づいて、入力映像を符号化する(S404)。これにより、符号化部106は、3D映像を構成する符号化済みの第1視点映像および第2視点映像を生成する。
また、符号化パラメータ設定部105が入力映像が2D映像であると判断した場合は(S401でNo)、符号化部106は、符号化パラメータ設定部105が設定した第2上限値に基づいて、入力映像を符号化する(S405)。これにより、符号化部106は、2D映像を構成する符号化済みの入力映像を生成する。
このように、本実施の形態およびその変形例におけるビデオカメラ100は、3D映像撮影モードであるか、2D映像撮影モードであるかによって、入力映像が3D映像か2D映像かを判断する。そして、当該ビデオカメラ100は、入力映像が3D映像であると判断した場合、レート制御部214で算出された量子化幅を、符号化パラメータ設定部105で設定した量子化幅の上限値で補正し、量子化幅が設定した上限値を超えないように符号化する。このように量子化幅を制御することにより、圧縮歪みを伴う3D映像を視聴したときの眼精疲労または映像酔いを抑制することができる。このため、ユーザが快適に3D映像を視聴することが可能となる。
(まとめ)
本実施の形態およびその変形例に係る映像符号化装置は、入力映像を符号化する映像符号化装置103であって、前記入力映像が3D映像であるか、2D映像であるかを判断する3D映像検出部104と、前記3D映像検出部104の判断結果に基づいて、符号化時に用いる量子化幅の上限値を設定する符号化パラメータ設定部105と、前記設定した上限値以下の量子化幅で、前記入力映像を符号化する符号化部106と、を備え、前記符号化パラメータ設定部105は、前記3D映像検出部104によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値と異なる値に設定する。
このようにすれば、2D映像を符号化する際に適用される量子化幅の上限値と、3D映像を符号化する際に適用される量子化幅の上限値とを異なるものに設定することができる。これにより、映像符号化装置103は、2D映像および3D映像の視聴特性に応じて、符号化条件を設定することが出来るため、2D映像および3D映像のそれぞれの映像特性に応じて符号化することが可能となる。したがって、映像符号化装置103は、は、3D映像として入力映像を符号化する際、立体視しやすい符号化映像を生成することができる。
また好ましくは、前記符号化パラメータ設定部105は、前記3D映像検出部104によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値よりも小さい値に設定する。
このようにすれば、映像符号化装置103は、2D映像を符号化するよりも3D映像を符号化するほうが、映像の圧縮歪みを低減することができる。これにより、例えば視聴者が3D映像を視聴する際にわざわざ符号化レートを変更せずとも、映像符号化装置は、3D映像として入力映像を符号化する際、自動的に2D映像よりも圧縮歪みを少なくすることができ、立体視しやすい符号化映像を生成することができる。
また好ましくは、前記符号化パラメータ設定部105は、前記入力映像のピクチャタイプ毎に異なる量子化幅の上限値を設定する。
このようにすれば、例えば、Iピクチャは、他のピクチャタイプに比べて量子化幅の上限値を高く設定することが出来る。これにより、映像符号化装置103は、ピクチャタイプの映像品位に応じて、符号化条件を設定することが出来るため、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
また好ましくは、前記符号化部106が前記入力映像の入力信号をインターレース信号として符号化する場合、前記符号化パラメータ設定部105は、前記入力映像のフィールド毎に異なる量子化幅の上限値を設定する。
このようにすれば、映像符号化装置103は、フィールド毎の映像特性に応じて、符号化条件を設定することが出来るため、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
また好ましくは、前記符号化パラメータ設定部105は、前記量子化幅に関連する情報である量子化マトリクスおよび量子化パラメータのうち、少なくとも一方の情報に対して、上限値を設定する。
このようにすれば、映像符号化装置103は、量子化マトリクスまたは量子化パラメータについて上限値を設定して量子化幅の上限値を設定することにより、3D映像として入力映像を符号化する際、より立体視しやすい符号化映像を生成することが出来る。
以上、本実施の形態およびその変形例について説明したが、本発明はこれに限定されるものではない。つまり、今回開示された実施の形態及びその変形例は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
例えば、本実施の形態およびその変形例においては、ビデオカメラ100として説明したが、放送波を受信するレコーダとしても構わない。
また、本実施の形態およびその変形例においては、映像符号化装置103は、ビデオカメラの撮影モードに従って、2D映像であるか3D映像であるかを判断していたが、入力映像のヘッダ情報に基づいて、2D映像であるか3D映像であるかを判断しても構わない。また、本発明が放送波を記録するレコーダで実現されている場合、映像符号化装置103は、入力映像である放送波に含まれる番組情報に基づいて、2D映像であるか3D映像であるかを判断しても構わない。
また、本実施の形態およびその変形例においては、映像符号化装置103は、符号化ストリームの符号化情報にしたがって、3D映像であるか、2D映像であるかを判断しているが、その他の方法でもよい。例えば、入力映像がサイド・バイ・サイド方式の3D映像である場合、映像符号化装置103は、左目用の画像データと、右目用の画像データとについてマッチング処理を実行し、得られた相関度によって、3D映像であるか、2D映像であるかを判断してもよい。
また、本実施の形態およびその変形例においては、圧縮符号化方式としてH.264を用いた場合を例に挙げたが、これに限るものではなく、例えばMPEG2といった、H.264以外の映像圧縮符号化方式に対して本発明を適用してもよい。
なお、本発明は、上記実施の形態およびその変形例における各手段を備える映像符号化装置として実現することができるばかりでなく、映像符号化装置が具備する各手段を各ステップとする映像符号化方法や、映像符号化装置が具備する各手段を備える映像符号化集積回路、および映像符号化方法に含まれるステップをコンピュータに実行させる映像符号化プログラムとして実現することも可能である。
そして、この映像符号化プログラムは、CD−ROM(Compact Disc−Read Only Memory)等の記録媒体やインターネット等の通信ネットワークを介して流通させることができる。
また、映像符号化集積回路は、典型的な集積回路であるLSIとして実現することができる。この場合、LSIは、1チップで構成しても良いし、複数チップで構成しても良い。例えば、メモリ以外の機能ブロックを1チップLSIで構成しても良い。なお、ここではLSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSIまたはウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよいし、LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらに、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。例えば、バイオ技術の適応等がその可能性として有り得ると考えられる。
また、集積回路化に際し、各機能ブロックのうち、データを格納するユニットだけを1チップ化構成に取り込まず、別構成としても良い。
本発明に係る映像符号化装置は、ユーザが快適に3D映像を視聴することができるように、H.264などの圧縮符号化方式による映像の符号化を行うことができるため、レコーダ、ビデオカメラ、デジタルカメラ、パーソナルコンピュータ、カメラ付き携帯電話機等に適用できる。
100 ビデオカメラ
101 制御部
102 撮像部
103 映像符号化装置
104 3D映像検出部
105 符号化パラメータ設定部
106 符号化部
107 記録部
201 入力映像データメモリ
202 参照画像データメモリ
203 面内予測部
204 動きベクトル検出部
205 動き補償部
206 予測モード判定部
207 差分演算部
208 直交変換部
209 量子化部
210 逆量子化部
211 逆直交変換部
212 加算部
213 エントロピー符号化部
214 レート制御部

Claims (6)

  1. 入力映像を符号化する映像符号化装置であって、
    前記入力映像が3D映像であるか、2D映像であるかを判断する判断部と、
    前記判断部の判断結果に基づいて、符号化時に用いる量子化幅の上限値を設定する設定部と、
    前記設定した上限値以下の量子化幅で、前記入力映像を符号化する符号化部と、を備え、
    前記設定部は、前記判断部によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値と異なる値に設定する
    映像符号化装置。
  2. 前記設定部は、前記判断部によって前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値よりも小さい値に設定する
    請求項1に記載の映像符号化装置。
  3. 前記設定部は、前記入力映像のピクチャタイプ毎に、異なる量子化幅の上限値を設定する
    請求項1または請求項2に記載の映像符号化装置。
  4. 前記符号化部が前記入力映像の入力信号をインターレース信号として符号化する場合、
    前記設定部は、前記入力映像のフィールド毎に、異なる量子化幅の上限値を設定する
    請求項1から請求項3のいずれか1項に記載の映像符号化装置。
  5. 前記設定部は、前記量子化幅に関連する情報である量子化マトリクスおよび量子化パラメータのうち、少なくとも一方の情報に対して、上限値を設定することで、前記量子化幅の上限値を設定する
    請求項1から請求項4のいずれか1項に記載の映像符号化装置。
  6. 入力映像を符号化する映像符号化方法であって、
    前記入力映像が3D映像であるか、2D映像であるかを判断する判断ステップと、
    前記判断ステップでの判断結果に基づいて、符号化時に用いる量子化幅の上限値を設定する設定ステップと、
    前記設定ステップで設定された上限値以下の量子化幅で、前記入力映像を符号化する符号化ステップと、を含み、
    前記設定ステップでは、前記判断ステップで前記入力映像が前記3D映像であると判断された場合に、前記3D映像に対する前記量子化幅の上限値を、前記2D映像に対する前記量子化幅の上限値と異なる値に設定する
    映像符号化方法。
JP2011251138A 2011-01-31 2011-11-16 映像符号化装置および映像符号化方法 Pending JP2012178818A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011251138A JP2012178818A (ja) 2011-01-31 2011-11-16 映像符号化装置および映像符号化方法
US13/358,578 US20120194643A1 (en) 2011-01-31 2012-01-26 Video coding device and video coding method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011017535 2011-01-31
JP2011017535 2011-01-31
JP2011251138A JP2012178818A (ja) 2011-01-31 2011-11-16 映像符号化装置および映像符号化方法

Publications (1)

Publication Number Publication Date
JP2012178818A true JP2012178818A (ja) 2012-09-13

Family

ID=46577044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011251138A Pending JP2012178818A (ja) 2011-01-31 2011-11-16 映像符号化装置および映像符号化方法

Country Status (2)

Country Link
US (1) US20120194643A1 (ja)
JP (1) JP2012178818A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020066326A1 (ja) * 2018-09-26 2020-04-02 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10057558B2 (en) * 2015-09-04 2018-08-21 Kabushiki Kaisha Toshiba Electronic apparatus and method for stereoscopic display

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978029A (en) * 1997-10-10 1999-11-02 International Business Machines Corporation Real-time encoding of video sequence employing two encoders and statistical analysis
US7180943B1 (en) * 2002-03-26 2007-02-20 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Compression of a data stream by selection among a set of compression tools
JP3989343B2 (ja) * 2002-09-20 2007-10-10 株式会社リコー 画像処理装置および画像処理方法、および画像処理方法を記録した記録媒体
US8325797B2 (en) * 2005-04-11 2012-12-04 Maxim Integrated Products, Inc. System and method of reduced-temporal-resolution update for video coding and quality control
JP2007089035A (ja) * 2005-09-26 2007-04-05 Toshiba Corp 動画像符号化方法、装置及びプログラム
EP1809042A1 (en) * 2006-01-13 2007-07-18 THOMSON Licensing Method and apparatus for coding interlaced video data
WO2009139303A1 (ja) * 2008-05-16 2009-11-19 シャープ株式会社 映像記録装置
JP2011250400A (ja) * 2010-04-27 2011-12-08 Panasonic Corp 動画像符号化装置及び動画像符号化方法
JP5748463B2 (ja) * 2010-12-02 2015-07-15 キヤノン株式会社 符号化装置およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020066326A1 (ja) * 2018-09-26 2020-04-02 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JPWO2020066326A1 (ja) * 2018-09-26 2021-08-30 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JP2021192544A (ja) * 2018-09-26 2021-12-16 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
US11223826B2 (en) 2018-09-26 2022-01-11 Fujifilm Corporation Image processing device, imaging device, image processing method, and image processing program
JP7174123B2 (ja) 2018-09-26 2022-11-17 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JP7498756B2 (ja) 2018-09-26 2024-06-12 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム

Also Published As

Publication number Publication date
US20120194643A1 (en) 2012-08-02

Similar Documents

Publication Publication Date Title
JP7159423B2 (ja) 映像復号化のための方法、装置及びコンピュータ・プログラム
CN113678441B (zh) 视频编解码的方法和装置
CN110944202B (zh) 视频编解码方法、装置、计算机设备和存储介质
KR102523002B1 (ko) 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
US9350972B2 (en) Encoding device and encoding method, and decoding device and decoding method
JP5156704B2 (ja) 画像符号化装置、画像符号化方法、集積回路及びカメラ
JP6039178B2 (ja) 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
CN113259661A (zh) 视频解码的方法和装置
JP2023164443A (ja) ビデオコーディングのための方法、装置、およびプログラム
JP2010063092A (ja) 画像符号化装置、画像符号化方法、画像符号化集積回路およびカメラ
JP5395911B2 (ja) ステレオ画像符号化装置、方法
US20220132137A1 (en) Image encoding/decoding method and device using symmetric motion vector difference (smvd), and method for transmitting bitstream
US20230370604A1 (en) Flexible scaling factors for joint mvd coding
JP2012178818A (ja) 映像符号化装置および映像符号化方法
US20130301723A1 (en) Video encoding apparatus and video encoding method
JP2023520594A (ja) ビデオ・コーディングのための方法及び装置
JP5322956B2 (ja) 画像符号化装置および画像符号化方法
US11936903B2 (en) Bilateral matching based scaling factor derivation for JMVD
JP6232117B2 (ja) 画像符号化方法、画像復号方法、及び記録媒体
US20230403406A1 (en) Motion coding using a geometrical model for video compression
CN118301345A (en) Video encoding and decoding method and device
JP2013179554A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム