JP6642573B2 - 符号化装置、復号装置及び伝送制御方法 - Google Patents

符号化装置、復号装置及び伝送制御方法 Download PDF

Info

Publication number
JP6642573B2
JP6642573B2 JP2017524670A JP2017524670A JP6642573B2 JP 6642573 B2 JP6642573 B2 JP 6642573B2 JP 2017524670 A JP2017524670 A JP 2017524670A JP 2017524670 A JP2017524670 A JP 2017524670A JP 6642573 B2 JP6642573 B2 JP 6642573B2
Authority
JP
Japan
Prior art keywords
tile
transmission
unit
video
tiles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017524670A
Other languages
English (en)
Other versions
JPWO2016208241A1 (ja
Inventor
勇司 藤本
勇司 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2016208241A1 publication Critical patent/JPWO2016208241A1/ja
Application granted granted Critical
Publication of JP6642573B2 publication Critical patent/JP6642573B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Closed-Circuit Television Systems (AREA)

Description

本開示は、符号化装置、復号装置及び伝送制御方法に関する。
高性能な端末の普及と有線及び無線ネットワークの広がりとによって、ネットワーク経由で映像を伝送し又は視聴する機会がますます増加している。限られたネットワーク帯域幅を用いて映像をリアルタイムで又は少なくとも低遅延で伝送しようとする場合、映像は、通常、伝送に先立って圧縮符号化され、帯域幅に合わせてレート制御される。そのような映像伝送の用途は、例えば、ビデオ会議、ビデオチャット、セキュリティカメラを通じた監視、及びライブ映像(スポーツ、コンサートなど)の配信を含み得る。
MPEG−2及びH.264/AVCといった従来の圧縮符号化技術は、フレーム内予測(イントラ予測)に加えて、フレーム間予測に基づく動き補償(インター予測)をサポートすることにより、高い符号化効率を達成している。しかし、伝送されるはずであった符号化情報がパケット欠損などの理由に起因して利用不能となった場合、フレーム間予測は機能せず、コンテンツの復号は失敗する。こうした失敗の後、イントラ予測のみを用いて符号化された画像(ここではI(Intra)ピクチャという)を一旦伝送することで、コンテンツの正常な復号/再生をリカバリすることができる。こうした伝送は、リフレッシュと呼ばれる。しかし、Iピクチャの符号量は、一般的に他のタイプのピクチャ(例えば、動き補償が利用可能なPピクチャ又はBピクチャ)と比較して格段に多いため、リカバリの期間中に伝送の遅延又は再度の復号失敗が発生することがある。
特許文献1は、上述したリフレッシュを部分領域ごとに複数フレームにわたって分散的に行うことで、リフレッシュの最中の符号量の増加を抑制する技術を開示している。特許文献2は、複数フレームにわたる分散的なリフレッシュの際にリカバリ済みでない領域へのフレーム間参照が行われないように動き補償の探索範囲を動的に制御する技術を開示している。
H.265/HEVC(以下、HEVCという)は、ITU−TとISO/IECとの共同の標準化団体であるJCTVC(Joint Collaboration Team-Video Coding)により標準化された、H.264/AVCの後継の圧縮符号化技術である(非特許文献1参照)。
特開平7−95564号公報 特開平7−95588号公報
ITU-T, "H.265: High efficiency video coding", Recommendation ITU-T H.265, 2014年10月
従来の複数フレームにわたる分散的なリフレッシュは、特許文献2で説明されているようなフレーム間参照の複雑な制御を必要とするため、デバイスの簡易な実装を妨げていた。
よって、より簡易な実装を可能にする技術が依然として望まれている。
本開示によれば、符号化すべき映像に含まれる画像の各々を複数のタイルへと分割し、前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定する設定部と、各画像をタイルごとに符号化して符号化ストリームを生成する符号化部と、前記映像を復号する復号装置への前記符号化ストリームの伝送を制御する伝送制御部と、を備え、前記設定部は、前記部分領域に含まれるタイルについて動き補償のためのタイル外参照を禁止に設定し、前記伝送制御部は、前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送を制限する、符号化装置が提供される。
また、本開示によれば、符号化装置において復号装置への映像の伝送を制御する伝送制御方法であって、符号化すべき映像に含まれる画像の各々を複数のタイルへと分割することと、前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定することと、各画像をタイルごとに符号化して符号化ストリームを生成することと、前記復号装置への前記符号化ストリームの伝送を制御することと、を含み、前記部分領域に含まれるタイルについて動き補償のためのタイル外参照は禁止に設定され、前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送が制限される、伝送制御方法が提供される。
また、本開示によれば、復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供する伝送制御部と、前記符号化装置から受信される前記映像の符号化ストリームから前記映像を復号する復号部と、を備え、通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、復号装置が提供される。
また、本開示によれば、復号装置において符号化装置からの映像の伝送を制御する伝送制御方法であって、復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供することと、
前記符号化装置から前記映像の符号化ストリームを受信することと、受信される前記符号化ストリームから前記映像を復号することと、を含み、通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、伝送制御方法が提供される。
本開示に係る技術は、映像を復号するための符号化情報が欠損し又は不在となった状況から適切な復号映像を得るための仕組みを、簡易に実装することを可能とする。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果と共に、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。
スライス分割を用いた分散リフレッシュについて説明するための説明図である。 スライス分割を用いた分散リフレッシュにおけるフレーム間参照の制御について説明するための説明図である。 スライス分割とタイル分割とを対比して示す説明図である。 HEVCにおけるタイル外参照の禁止の設定について説明するための説明図である。 一実施形態に係る映像伝送システムの構成の一例を示すブロック図である。 符号化装置の構成の一例を示すブロック図である。 リカバリ用伝送領域の基本的なアイディアについて説明するための説明図である。 リカバリ用伝送領域を決定する手法の第1の例について説明するための説明図である。 リカバリ用伝送領域を決定する手法の第2の例について説明するための説明図である。 リカバリ用伝送領域を決定する手法の第3の例について説明するための説明図である。 領域内リカバリの一例について説明するための説明図である。 伝送領域拡大の第1の例について説明するための説明図である。 伝送領域拡大の第2の例について説明するための説明図である。 中途再生時のリカバリの一例について説明するための説明図である。 シーン変化時のリカバリの一例について説明するための説明図である。 一実施形態に係る符号化側の伝送制御処理の流れの一例を示すフローチャートである。 図12に示した領域設定処理の詳細な流れの第1の例を示すフローチャートである。 図12に示した領域設定処理の詳細な流れの第2の例を示すフローチャートである。 図12に示した領域リフレッシュ処理の詳細な流れの一例を示すフローチャートである。 図12に示したタイルリフレッシュ処理の詳細な流れの一例を示すフローチャートである。 図12に示した領域拡大処理の詳細な流れの第1の例を示すフローチャートである。 図12に示した領域拡大処理の詳細な流れの第2の例を示すフローチャートである。 復号装置の構成の一例を示すブロック図である。 部分画像のスケーリングの一例について説明するための説明図である。 部分画像の矩形表示の一例について説明するための説明図である。 一実施形態に係る復号側の伝送制御処理の流れの一例を示すフローチャートである。 装置のハードウェア構成の一例を示すブロック図である。 テレビジョン装置の概略的な構成の一例を示すブロック図である。 携帯電話機の概略的な構成の一例を示すブロック図である。 記録再生装置の概略的な構成の一例を示すブロック図である。 撮像装置の概略的な構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下の順序で説明を行う。
1.導入
1−1.関連技術の説明
1−2.HEVCにおけるタイル分割
2.システムの概要
3.符号化装置の構成
3−1.基本的な構成
3−2.リカバリ用伝送領域の設定
3−3.パケット欠損時のリカバリ
3−4.他の事象によりトリガされるリカバリ
4.符号化時の処理の流れ
5.復号装置の構成
6.復号時の処理の流れ
7.ハードウェア構成例
8.応用例
9.まとめ
<1.導入>
[1−1.関連技術の説明]
上述したように、従来の圧縮符号化技術の多くは、イントラ予測及びインター予測という2種類の予測符号化モードをサポートする。インター予測は、フレーム間予測に基づく動き補償を包含し、高い符号化効率の達成に寄与する。しかし、参照すべき符号化情報の欠損又は不在に起因して、フレーム間予測が機能せず、コンテンツの復号が失敗することがある。復号失敗が発生した後、イントラ予測のみを用いて符号化されたIピクチャを一旦伝送することで、コンテンツの正常な復号/再生をリカバリすることができる。しかし、このリフレッシュの最中に、Iピクチャの符号化のための符号量の増加が、伝送の遅延又は再度の復号失敗を招来する恐れがある。特許文献1及び2により開示されている分散リフレッシュは、こうしたリカバリ期間中の符号量の増加を抑制する。
分散リフレッシュは、例えば、H.264/AVC及びHEVCにおいてサポートされているスライス分割を用いて実装されることができる。スライスは、水平方向に沿ったストライプ状にピクチャを分割することにより形成される、符号化処理の単位の1タイプである。図1Aは、スライス分割を用いた分散リフレッシュについて説明するための説明図である。図1Aを参照すると、ピクチャP00、P01、P02、P03及びP04が復号順に並べられている。これらピクチャの各々は、一例として、4つのスライスSL1、SL2、SL3及びSL4に分割されている。ここで、ピクチャP00において、符号化情報の欠損又は不在に起因する復号失敗が発生したものとする。復号失敗を認識したエンコーダは、後続する最初のピクチャP01のスライスSL1を、イントラスライスに設定する。4つのスライスSL1、SL2、SL3及びSL4のうちのスライスSL1のみをイントラスライスとして符号化することで、ピクチャP01全体をイントラピクチャに設定するケースと比較して、符号量の増加が抑制される。続いて、エンコーダは、2番目のピクチャP02のスライスSL2、3番目のピクチャP03のスライスSL3及び4番目のピクチャP04のスライスSL4を順にイントラスライスとして符号化する。このように順次イントラスライスに設定された4つのスライスについてデコーダ側で復号が完了すると、ピクチャ全体の正常な復号/再生が再び可能となる。
図1Aに示したようにイントラスライスの設定を複数のフレームにわたって分散させることで、発生する符号量のピークが伝送帯域幅に収まる可能性が高まる。しかし、コンテンツを適切に復号するためには、次に説明するような追加的な制御をさらに要する。図1Bは、スライス分割を用いた分散リフレッシュにおけるフレーム間参照の制御について説明するための説明図である。図1Bには、図1Aに示したピクチャのうちのピクチャP01、P02及びP03が再び示されている。ピクチャP01が復号される時点で、スライスSL1は、イントラスライスであることから、新たな情報の欠損が生じない限りは復号可能である。一方、スライスSL2、SL3及びSL4は、イントラスライスではないことから、過去のピクチャの復号失敗の影響を受けて、復号不能であり得る(即ち、この時点ではリカバリされない)。ピクチャP02が復号される時点で、今度はスライスSL2がイントラスライスであり、よってスライスSL2は復号可能である。スライスSL3及びSL4は、依然としてイントラスライスではないことから、未だリカバリされない。スライスSL1は、リカバリ済みであるものの、イントラスライスではないことから、例えば参照ピクチャP01の(未リカバリの)スライスSL2、SL3又はSL4を参照しようとすると、再び復号不能となる。そのため、エンコーダは、Pスライス又はBスライスであるはずのピクチャP02のスライスSL1のフレーム間予測を、ピクチャP01のスライスSL2、SL3及びSL4が参照されないように制御する。同様に、ピクチャP03について、エンコーダは、Pスライス又はBスライスであるはずのスライスSL1及びSL2のフレーム間予測を、ピクチャP02のスライスSL3及びSL4(並びに、より以前のピクチャの復号不能スライス)が参照されないように制御する。
このように、従来の分散リフレッシュの手法は、これをH.264/AVCのスライス分割と組み合わせて活用することができるものの、比較的複雑なフレーム間参照の制御を追加的に実装することをデバイスの開発者に要求する。よって、リアルタイムで又は少なくとも低遅延での伝送を前提として、伝送帯域幅が限られている状況での安定的な映像の伝送を、より簡易な実装で実現することを可能にする技術が依然として望まれている。本開示に係る技術の発明者は、HEVCにおいて採用されたタイル分割がこうした簡易な実装に適したフレームワークであることを見出した。
[1−2.HEVCにおけるタイル分割]
図2Aは、H.264/AVC又はHEVCにおけるスライス分割と、HEVCにおけるタイル分割とを対比的に示している。スライスは、上述したように、水平方向に沿ったストライプ状にピクチャを分割することにより形成される。あるスライスと次のスライスとの間の境界は必ずしもピクチャの端部に無くてもよく、ピクチャ内でラスタスキャン順に並ぶLCUの中の任意の連続する2つのLCUの間の境界がスライス境界になり得る(図2Aの左にその一例が示されている)。一方、タイルは、ピクチャを格子状に分割することにより形成される。図2Aの右の例では、2行及び2列で合計4つのタイルT1〜T4が形成されている。ピクチャを符号化し又は復号する際に、LCUは各タイル内でラスタスキャン順に処理される(図中の矢印参照)。同じピクチャ内で、ループフィルタなどの一部の例外を除いてタイル間に依存関係が存在しないため、タイルごとの並列処理が可能である。なお、図2Aの例に限定されず、1つのピクチャ内でタイルのサイズは均等でなくてもよい。
HEVCでは、拡張的な補足情報を指定するSEI(Supplemental Enhancement Information)メッセージの1つであるtemporal motion-constrained tile sets SEI messageのシンタックスに、タイル外参照が行われるか否かを定義するパラメータが含まれる。非特許文献1において仕様化されているこのメッセージのシンタックスを、下表に示す。
Figure 0006642573
表の第1行のフラグmc_all_tiles_exact_sample_value_match_flagがTrue(=“1”)である場合、タイルセット内の各タイルは他のタイルを参照することなく符号化され、タイル境界はピクチャ境界と同様に扱われる。即ち、この場合、タイル外参照は、タイルセット内で共通的に禁止される。第16行のフラグmc_exact_sample_value_match_flag[i]がTrueである場合、タイルセット内のi番目のタイルは他のタイルを参照することなく符号化され、i番目のタイルのタイル境界はピクチャ境界と同様に扱われる。即ち、フラグmc_exact_sample_value_match_flag[i]を利用することで、個別のタイルについてタイル外参照を禁止し又は許可することができる。本明細書では、これらフラグのうちの少なくとも1つをタイル外参照禁止フラグという。第4行のフラグlimited_tile_set_display_flagがTrueである場合、i個のタイルについてそれぞれ第9行のフラグdisplay_tile_set_flag[i]が符号化される。フラグdisplay_tile_set_flag[i]がTrueである場合、i番目のタイルが表示されることが意図される。よって、フラグdisplay_tile_set_flag[i]を、デコーダ側でのタイル別の表示/非表示をエンコーダから指示するために活用することができる。
図2Bは、HEVCにおけるタイル外参照の禁止の設定について説明するための説明図である。図2Bには、タイルT1〜T4へと分割されるピクチャP11及びP12が示されている。ピクチャP12は、ピクチャP11に後続するピクチャである。一例として、タイルT1についてタイル外参照禁止フラグがTrueに設定されると、ピクチャP12が復号される際、タイルT1と他のタイルとの間のタイル境界は、ピクチャ境界と同様に扱われる。タイルT1の動き補償において、ピクチャP11(又はその他の参照ピクチャ)のタイルT2、T3及びT4を参照することは禁止される。一方、ピクチャP12のタイルT1からピクチャP11のタイルT1を参照すること(即ち、タイル内参照)は禁止されない。このように、HEVCにおいて採用されたタイル分割のフレームワークは、画像の部分領域ごとの参照関係の制御に適した形で設計されている。このフレームワークの設計の主な狙いは、デコーダでの高度な並列処理の実現であった。しかし、次節以降で本開示に係る技術の実施形態として詳しく説明するように、タイル分割のフレームワークを分散リフレッシュの実装のために活用することが可能である。
<2.システムの概要>
図3は、本開示に係る技術の一実施形態に係る映像伝送システム1の構成の一例を示している。映像伝送システム1は、少なくとも1つの符号化装置10a、10bと、少なくとも1つの復号装置60a、60b、60cとを含む。これら装置は、ネットワーク5を介して互いに接続される。
図3の例において、符号化装置10aは、タブレットPC(Personal Computer)又はスマートフォンなどの携帯端末である。符号化装置10bは、ビデオカメラである。本明細書において、符号化装置10a及び10bを互いに区別する必要の無い場合には、これらを符号化装置10と総称する。符号化装置10は、自ら撮像し又は他の装置により撮像された映像を符号化するためのエンコーダを有し、エンコーダにより生成される符号化ストリームをネットワーク5を介して復号装置60へとストリーミングする。ネットワーク通信用の通信インタフェースは、符号化装置10の内部に設けられてもよく、又は外部に設けられてもよい。
図3の例において、復号装置60aは、ノートブックPCである。復号装置60bは、タブレットPC又はスマートフォンなどの携帯端末である。復号装置60cは、テレビジョン受像機である。本明細書において、復号装置60a、60b及び60cを互いに区別する必要の無い場合には、これらを復号装置60と総称する。復号装置60は、ネットワーク5を介して受信される符号化ストリームから映像を復号するためのデコーダを有する。復号装置60は、デコーダにより復号される映像を再生するためのディスプレイをさらに有していてもよい。通信インタフェース及びディスプレイは、復号装置60の内部に設けられてもよく、又は外部に設けられてもよい。
ネットワーク5は、GSM、LTE(Long Term Evolution)、LTE−Advanced、WiMAX若しくは無線LAN(Local Area Network)などの無線ネットワークであってもよく、又は有線ネットワークであってもよい。ネットワーク5は、少なくとも一部に帯域幅の狭いリンクを包含し得る。符号化装置10及び復号装置60は、送受信される符号化ストリームの符号量のピークがネットワーク5の帯域幅を超過しないように、上述したタイル分割のフレームワークを活用する。
<3.符号化装置の構成>
[3−1.基本的な構成]
図4は、符号化装置10の構成の一例を示すブロック図である。図4を参照すると、符号化装置10は、並び替えバッファ11、タイル設定部12、減算部13、直交変換部14、量子化部15、可逆符号化部16、伝送制御部17、レート制御部18、逆量子化部21、逆直交変換部22、加算部23、デブロックフィルタ24、SAOフィルタ25、フレームメモリ26、スイッチ27、モード設定部28、イントラ予測部30及びインター予測部40を備える。
並び替えバッファ11は、符号化すべき映像を構成する一連の画像の画像データを、符号化処理に係るGOP(Group of Pictures)構造に応じて並び替える。並び替えバッファ11は、並び替え後の画像データをタイル設定部12、イントラ予測部30及びインター予測部40へ出力する。
タイル設定部12は、ピクチャに相当する画像の各々を複数のタイルへと分割する。各ピクチャに含まれるタイルの数はいくつであってもよく、各タイルはいかなるサイズを有していてもよい。タイル分割の態様(タイルの数及び各タイルのサイズ)は、典型的には複数のフレームわたって維持され、但し何らかのタイミングでタイル分割の態様は変化してもよい。
本実施形態において、タイル設定部12は、複数のタイルのうちの1つ以上を含む部分領域であるリカバリ用伝送領域を、符号化すべき画像へ設定する。リカバリ用伝送領域は、復号側での符号化情報の欠損又は不在が符号化装置10又は復号装置60において検出された後、リカバリが完了するまでの期間中に伝送の対象とされる領域である。リカバリ用伝送領域を設定するための手法のいくつかの例について、後にさらに説明する。また、タイル設定部12は、リカバリ期間中のタイルごとの予測符号化モードの設定を制御する。例えば、後にさらに説明するように、リカバリ用伝送領域内のタイルのうち符号化情報の欠損又は不在に起因して復号不能となったタイルは、リカバリ期間中に少なくとも一度、イントラタイルに設定される。イントラタイルとは、タイル内の全てのブロックについて予測符号化のためにイントラ予測のみが使用されるタイルである。一方、符号化ストリームが正常に伝送されている通常の期間中の伝送の対象は、ピクチャ全体であってよい。
後述する減算部13からインター予測部40までの典型的なエンコーダの処理は、タイル設定部12によるタイル分割に従って、タイル単位で実行される。タイル設定部12は、リカバリ用伝送領域に含まれるタイルについて、動き補償のためのタイル外参照を禁止に設定する。そして、タイル設定部12は、タイル分割の態様を示すタイルパラメータと、上述したタイル外参照禁止フラグとを含み得るタイル情報を生成し、生成したタイル情報を可逆符号化部16へ出力する。
減算部13は、タイル設定部12から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部14へ出力する。
直交変換部14は、各タイル内のCTUに設定される1つ以上のTUの各々について直交変換処理を実行する。ここでの直交変換は例えば、離散コサイン変換又は離散サイン変換などであってよい。より具体的には、直交変換部14は、減算部13から入力される予測誤差データを、TUごとに、空間領域の画像信号から周波数領域の変換係数データに変換する。そして、直交変換部14は、変換係数データを量子化部15へ出力する。
量子化部15には、直交変換部14から入力される変換係数データ、及び後に説明するレート制御部18からのレート制御信号が供給される。量子化部15は、レート制御信号に従って決定される量子化ステップで変換係数データを量子化する。量子化部15は、量子化後の変換係数データ(以下、量子化データという)を可逆符号化部16及び逆量子化部21へ出力する。
可逆符号化部16は、各タイルについて量子化部15から入力される量子化データを符号化することにより、符号化ストリームを生成する。また、可逆符号化部16は、デコーダにより参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ストリームへ挿入する。可逆符号化部16により符号化されるパラメータは、上述したタイル情報、イントラ予測に関する情報、及びインター予測に関する情報を含み得る。可逆符号化部16は、生成した符号化ストリームを伝送制御部17へ出力する。
伝送制御部17は、可逆符号化部16から入力される符号化ストリームのネットワーク5を介する復号装置60への伝送を制御する。伝送制御部17は、例えば、復号装置60から伝送要求が受信されると、映像コンテンツの符号化ストリームの伝送を開始する。伝送制御部17により伝送される符号化ストリームは、伝送領域に含まれるタイルに対応する符号化ストリームである。典型的には、通常の期間中の伝送領域は、ピクチャ全体に相当する。また、伝送制御部17は、リカバリを開始すべき事象の発生を監視する。リカバリを開始すべき事象は、例えば、映像を復号する装置における符号化情報の欠損又は不在を含む。必要とされる符号化情報の欠損は、例えば、伝送経路の輻輳又は一時的な伝送品質の低下などに起因するパケット欠損の結果として生じ得る。必要とされる符号化情報の不在は、例えば、映像コンテンツの中途からの再生が要求された場合に生じ得る(再生開始時点よりも前の参照ピクチャの情報が伝送されていない)。伝送制御部17は、こうした事象を検出すると、伝送領域をタイル設定部12により予め設定されたリカバリ用伝送領域へと縮小し、リカバリ用伝送領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように伝送を制限する。リカバリ期間中は、伝送領域はリカバリ用伝送領域に等しい。リカバリが完了すると、伝送領域はピクチャ全体へと、リカバリ用伝送領域は部分領域へと再設定される。
レート制御部18は、伝送制御部17により判定される所望の伝送レートに応じてレート制御信号を生成し、生成したレート制御信号を量子化部15へ出力する。例えば、レート制御部18は、所望の伝送レートが相対的に低い時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部18は、所望の伝送レートが相対的に高い時には、量子化データのビットレートを高めるためのレート制御信号を生成する。
逆量子化部21、逆直交変換部22及び加算部23は、ローカルデコーダを構成する。ローカルデコーダは、符号化されたデータから原画像を再構築(リコンストラクト)する役割を有する。
逆量子化部21は、量子化部15により使用されたものと同じ量子化ステップで量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部21は、復元した変換係数データを逆直交変換部22へ出力する。
逆直交変換部22は、逆量子化部21から入力される変換係数データについて逆直交変換処理を実行することにより、予測誤差データを復元する。そして、逆直交変換部22は、復元した予測誤差データを加算部23へ出力する。
加算部23は、逆直交変換部22から入力される復元された予測誤差データとイントラ予測部30又はインター予測部40により生成される予測画像データとを加算することにより、復号画像データ(リコンストラクト画像)を生成する。そして、加算部23は、生成した復号画像データをデブロックフィルタ24及びフレームメモリ26へ出力する。
デブロックフィルタ24及びSAOフィルタ25は、それぞれ、リコンストラクト画像の画質の向上を目的とするインループフィルタである。デブロックフィルタ24は、加算部23から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをSAOフィルタ25へ出力する。SAOフィルタ25は、デブロックフィルタ24から入力される復号画像データにエッジオフセット処理又はバンドオフセット処理を適用することによりノイズを除去し、処理後の復号画像データをフレームメモリ26へ出力する。
フレームメモリ26は、加算部23から入力されるフィルタリング前の復号画像データ、及びSAOフィルタ25から入力されるインループフィルタの適用後の復号画像データを記憶媒体を用いて記憶する。
スイッチ27は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ26から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部30に供給する。また、スイッチ27は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ26から読み出し、読み出した復号画像データを参照画像データとしてインター予測部40に供給する。
モード設定部28は、イントラ予測部30及びインター予測部40から入力されるコストの比較に基づいて、CTUごとに予測符号化モードを設定する。但し、モード設定部28は、イントラタイルとして設定されるタイルについては、当該タイル内の全てのCTUの予測符号化モードをイントラ予測モードに設定する。モード設定部28は、イントラ予測モードを設定したCTUについては、イントラ予測部30により生成される予測画像データを減算部13へ出力すると共に、イントラ予測に関する情報を可逆符号化部16へ出力する。また、モード設定部28は、インター予測モードを設定したCTUについては、インター予測部40により生成される予測画像データを減算部13へ出力すると共に、インター予測に関する情報を可逆符号化部16へ出力する。
イントラ予測部30は、原画像データ及び復号画像データに基づいて、各タイル内のCTUに設定される1つ以上のPUの各々についてイントラ予測処理を実行する。例えば、イントラ予測部30は、探索範囲に含まれる予測モード候補の各々について、予測誤差及び発生する符号量に基づくコストを評価する。次に、イントラ予測部30は、コストが最小となる予測モードを最適な予測モードとして選択する。また、イントラ予測部30は、選択した最適な予測モードに従って予測画像データを生成する。そして、イントラ予測部30は、最適な予測モードを示す予測モード情報を含むイントラ予測に関する情報、対応するコスト、及び予測画像データを、モード設定部28へ出力する。
インター予測部40は、原画像データ及び復号画像データに基づいて、各タイル内のCTUに設定される1つ以上のPUの各々についてインター予測処理(動き補償)を実行する。例えば、インター予測部40は、探索範囲に含まれる予測モード候補の各々について、予測誤差及び発生する符号量に基づくコストを評価する。動き補償のための動きベクトルの探索の際に、インター予測部40は、タイル外参照禁止フラグがTrueに設定されているタイルについては、全ての参照ピクチャにわたって、同じ位置のタイルのみを探索範囲に含める。次に、インター予測部40は、コストが最小となる予測モードを最適な予測モードとして選択する。また、インター予測部40は、選択した最適な予測モードに従って予測画像データを生成する。そして、インター予測部40は、インター予測に関する情報、対応するコスト、及び予測画像データを、モード設定部28へ出力する。
[3−2.リカバリ用伝送領域の設定]
本項では、タイル設定部12により設定されるリカバリ用伝送領域について、より詳しく説明する。
(1)基本的なアイディア
図5は、リカバリ用伝送領域の基本的なアイディアについて説明するための説明図である。図5には、水平方向に沿って時間軸が示されており、時刻tから時刻t10までのいくつかのタイミングがプロットされている。時間軸の下には、各タイミングにおいて符号化されるピクチャと、復号装置へと伝送されるピクチャとが示されている。ここでは、各ピクチャは、4行4列で16個のタイルへと分割されるものとする。時刻tでは、通常の伝送が行われており、伝送領域R1はピクチャ全体に相当する。タイル設定部12により設定されたリカバリ用伝送領域R2は、ピクチャの中央の2行2列で4個のタイルを占める。リカバリ用伝送領域R2外のタイルも、この時点では伝送される。
時刻tにおいて伝送領域は変化しないが、伝送の結果として符号化情報が欠損し、一部のタイルが復号不能となる。伝送制御部17は、時刻tにおいて、こうした欠損を、例えば復号装置60(又はネットワーク5内のいずれかのノード)からのシグナリングに基づいて検出し、復号不能となったタイルを判定する。時刻tにおいて、伝送制御部17は、伝送領域R1をリカバリ用伝送領域R2に一致するように縮小し、リカバリ用伝送領域R2内の4個のタイルに対応する符号化ストリームのみが伝送される。こうした伝送の制限は、時刻tにおいても継続され、この間に、イントラタイルの符号化、伝送及び復号を通じて、リカバリ用伝送領域R2内の画像の正常な復号/再生へのリカバリが行われる。
時刻tを含むリカバリ期間の後半において、タイル設定部12は、リカバリ用伝送領域R2(=伝送領域R1)を、タイル単位で漸進的に拡大する。新たな拡大部分に対応するタイルは、イントラタイルとして符号化される。リカバリ用伝送領域R2外のタイルが復号不能となった場合、こうした領域の漸進的な拡大を通じて、一旦復号不能となったタイルの画像の正常な復号/再生へのリカバリが行われる。
全てのタイルの画像の正常な復号/再生が完了すると、時刻t10において、リカバリ用伝送領域R2が再設定される。ここでのリカバリ用伝送領域R2は、時刻tにおいて設定されていた領域と等しくてもよく、又は異なってもよい。伝送領域R1は、ピクチャ全体に相当する。
(2)リカバリ用伝送領域の決定
図6Aは、リカバリ用伝送領域を決定する手法の第1の例について説明するための説明図である。図6Aの例において、ピクチャP3aは、セキュリティカメラにより撮像される映像に含まれる1つのフレームである。ピクチャP3aは、監視される街路の一角を映している。リカバリ用伝送領域R2aは、安定的な監視が望まれる、ピクチャP3aの中央の矩形の領域である。例えば、セキュリティカメラをセットアップする運用者であるユーザが、こうしたリカバリ用伝送領域を定義する。リカバリ用伝送領域を定義する領域情報は、予め生成され、符号化装置10のメモリにより記憶され得る。タイル設定部12は、こうした領域情報をメモリから読み出し、ピクチャP3a(及び後続のピクチャ群)にリカバリ用伝送領域R2aを設定し得る。
図6Bは、リカバリ用伝送領域を決定する手法の第2の例について説明するための説明図である。図6Bの例において、ピクチャP3bは、ビデオ会議システムを通じて伝送される映像に含まれる1つのフレームである。タイル設定部12は、例えば、映像コンテンツを解析することにより会議への参加者が主に映っている領域(人体領域又は顔領域など)を認識し、認識した領域をリカバリ用伝送領域R2bとしてピクチャP3bに設定し得る。
図6A及び図6Bの例のように、リカバリ用伝送領域は、限定ではないものの、ユーザレベル又はアプリケーションレベルの要件に依存する、注目すべき(安定的な映像が提供されるべき)重要な注目領域であってよい。その代わりに、リカバリ用伝送領域は、そうした要件とは関係無く定義される固定的な領域であってもよい。他の例として、スポーツ映像の配信の用途では、試合が行われているフィールドが映る領域がリカバリ用伝送領域として決定されてもよい。また、コンサート映像の配信の用途では、アーティスト又はステージが映る領域がリカバリ用伝送領域として決定されてもよい。
図6Cは、リカバリ用伝送領域を決定する手法の第3の例について説明するための説明図である。図6Cの例では、復号装置60aにより復号されディスプレイに表示される映像を視聴するユーザが、安定的な映像の再生が求められる部分領域として、リカバリ用伝送領域R2cを決定する。復号装置60aは、ユーザインタフェースを介して取得されるユーザ入力に基づいてリカバリ用伝送領域R2cに関する領域情報を生成し、生成した領域情報を映像の伝送元である符号化装置10bへ提供する。符号化装置10bのタイル設定部12は、このように復号装置60aから受信される領域情報に基づいて、リカバリ用伝送領域R2cを画像へ設定する。
[3−3.パケット欠損時のリカバリ]
本項では、リカバリ用伝送領域への伝送領域の縮小とタイルベースの分散リフレッシュとを通じて、映像コンテンツの正常な復号/再生へのリカバリがどのように行われ得るのかを、より詳細に説明する。本実施形態において、リカバリ期間は、例えば図5の時刻t 及びtを含み得る領域内リカバリのための期間と、図6の時刻tを含み得る伝送領域拡大のための期間とに分けられる。但し、復号不能となったタイルがリカバリ用伝送領域の外にのみ存在する場合には、領域内リカバリは行われなくてよい。
(1)領域内リカバリ
図7は、領域内リカバリの一例について説明するための説明図である。図7の例では、リカバリ用伝送領域R3は、ピクチャの右上の3行3列で9個のタイルを占める。符号化情報の欠損が検出される前に、リカバリ用伝送領域R3に含まれるタイルのタイル外参照は禁止に設定される(図中左上)。リカバリ用伝送領域R3に含まれないタイルのタイル外参照は、許可されてもよく又は禁止されてもよい。そして、例えばリカバリ用伝送領域R3に含まれるタイルT15が符号化情報の欠損に起因して復号不能となる(図中左下)と、伝送制御部17は伝送領域をリカバリ用伝送領域R3へと縮小し、可逆符号化部16はタイルT15をイントラタイルとして符号化する(図中右上)。そして、イントラタイルであるタイルT15に対応する符号化ストリームは、伝送制御部17により伝送が制限されている期間中に復号側へと伝送される。
上述したように、タイルT15をイントラタイルとして符号化した場合、そうでない場合(即ち、インター予測が許容される場合)と比較してタイルT15について発生する符号量は増加する。しかし、イントラタイルはピクチャの一部分に限られる。また、伝送領域がリカバリ用伝送領域R3へと縮小され、同領域外のタイルに対応する符号化ストリームはリカバリ期間中に伝送されないため、イントラタイルに対応する符号化ストリームが消費可能な帯域幅が一時的に増大する。こうしたアプローチを通じて、リカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクが低減される。また、帯域幅のオーバフローを防止するために画質を劣化させるような望ましくない処理(例えば、過度の量子化など)を行うことも不要となる。リカバリ用伝送領域R3内のタイルの各々においてタイル外参照が予め禁止に設定されているため、符号化情報の欠損の影響は、情報が直接的に失われたタイルのみに局所化される。即ち、図7の例では、タイルT15は、一旦復号不能となった後にイントラタイルでの符号化/復号を通じてリカバリされる一方、リカバリ用伝送領域R3内の他のタイル(例えば、タイルT12、T13及びT14)は、欠損の影響を受けることなく、引き続きインター予測可能である。よって、リカバリ期間中にこれらタイルをイントラタイルで符号化/復号する必要性もまた回避される。リカバリ期間中に、タイル外参照が許可されたタイルに対応する符号化ストリームは伝送されないため、伝送対象の全てのタイルについてフレーム間予測の参照エラーは発生しないはずである。
なお、図7の例では1つのタイルT15のみがイントラタイルに設定されているが、符号化情報の欠損の影響の度合いに応じて、イントラタイルに設定すべきタイルの数は異なる。影響が複数のタイルにわたる場合、タイル設定部12は、1ピクチャ当たりいくつのタイルをイントラタイルに設定するかを、利用可能な伝送帯域幅に依存して決定してもよい。
(2)伝送領域拡大−第1の例
図8は、伝送領域拡大の第1の例について説明するための説明図である。図8には、図7を用いて説明した領域内リカバリに続いて復号側へ伝送されるピクチャの例が、順に示されている。タイルT15がイントラタイルでの符号化/復号を通じてリカバリされると、リカバリ用伝送領域R3内の全てのタイルが復号可能となる。その後、タイル設定部12は、伝送領域拡大期間中に、リカバリ用伝送領域R3をタイル単位で漸進的に拡大する。図8の例では、1ピクチャ当たり1タイルずつ、リカバリ用伝送領域R3が拡大されている(T21→T22→T23…)。この間、符号化部16は、リカバリ用伝送領域R3の新たな拡大部分に対応するタイルを、イントラタイルとして符号化する。ここでも、イントラタイルはピクチャの一部分に限られるため、符号量のピークは抑制される。また、タイル外参照が許可されたタイルに対応する符号化ストリームは伝送されないため、伝送対象の全てのタイルについてフレーム間予測の参照エラーが新たに発生することを回避しつつ、復号可能な領域を拡大していくことができる。リカバリ用伝送領域R3外のタイルが符号化情報の欠損に起因して復号不能となった場合、そのタイルは、こうしたリカバリ用伝送領域R3の漸進的な拡大を通じて、伝送領域拡大の期間中に復号可能となる。
タイル設定部12は、リカバリ用伝送領域の上述した漸進的な拡大を通じて全てのタイルが復号可能となった後に、リカバリ用伝送領域を部分領域に再設定する。この再設定の一例は、図5に示されている。リカバリ用伝送領域が再設定されると、リカバリ期間は終了し、通常の伝送が再開される。
(3)伝送領域拡大−第2の例
図9は、伝送領域拡大の第2の例について説明するための説明図である。図9には、図8と同様に、図7を用いて説明した領域内リカバリに続いて復号側へ伝送されるピクチャの例が、順に示されている。第2の例において、タイル設定部12は、伝送制御部17により伝送が制限されている期間中に、伝送帯域幅の利用可能性に基づいて動的に決定されるタイミングで、リカバリ用伝送領域を拡大する。図9の例では、タイルT21がリカバリ用伝送領域R3に組み入れられた次のピクチャでは、利用可能な伝送帯域幅が小さいことから(例えば、注目領域の絵柄の変動が大きい場合、注目領域のために多くの帯域幅が消費される)、リカバリ用伝送領域R3は拡大されない。その後、十分な伝送帯域幅が得られるタイミングで、タイルT22、タイルT23といった順に、リカバリ用伝送領域R3が漸進的に拡大される。本実施形態によれば、タイル外参照の禁止によってリカバリ期間中のタイル間でのエラーの伝播が防止されるため、ネットワーク帯域幅が限られている状況において、このように動的に決定される任意のタイミングで、安全にイントラタイルを追加することができる。当初設定したリカバリ用伝送領域内の映像は、リカバリ期間中であっても継続的かつ安定的に復号/再生される。
図8及び図9に示した例から理解されるように、伝送領域拡大の期間中には、伝送領域は一時的に非矩形の形状をとり得る。タイル設定部12は、このように伝送領域(リカバリ用伝送領域に等しい)が矩形ではない場合に、復号装置60により復号される画像が矩形で表示されるように、タイルごとの表示又は非表示を設定してもよい。例えば、矩形の部分から外れるタイルについて表1を用いて説明したフラグdisplay_tile_set_flag[i]をFalse(=“0”)に設定し、他のタイルについて同フラグをTrueに設定することにより、デコーダ側での追加的な実装を要することなく、表示される画像を矩形にすることができる。
[3−4.他の事象によりトリガされるリカバリ]
本実施形態において、リカバリをトリガする事象の一例は、上述したパケットの欠損である。リカバリをトリガする事象の他の例は、映像コンテンツの中途再生及びシーン変化を含み得る。
(1)中途再生
図10は、中途再生時のリカバリの一例について説明するための説明図である。図10を参照すると、図5と同様の時間軸が再び示されており、時刻tから時刻t10までのいくつかのタイミングがプロットされている。但し、図5の例では時刻tからtにかけて通常の伝送が行われていたのに対し、ここでは符号化装置10により映像は符号化されるものの、符号化ストリームは復号装置60へ伝送されない。そして、伝送制御部17は、時刻tにおいて、映像コンテンツを視聴しようとするユーザから、ピクチャP4からの中途再生を求める要求を受信する。この時点で、復号側では、ピクチャP4の復号のために参照されるはずであった参照フレームの符号化情報が不在である。時刻tにおいて、伝送制御部17は、伝送領域R1をリカバリ用伝送領域R4に一致するように縮小し、リカバリ用伝送領域R4内の2個のタイルに対応する符号化ストリームのみが伝送される。タイル設定部12は、リカバリ用伝送領域R4内のタイルをイントラタイルに設定するため、これらタイルは中途再生に関わらず復号可能である。また、伝送領域を縮小することにより、イントラタイルから生じる符号化ストリームのためにより多くの帯域幅を割り当てることが可能となるため、中途再生の開始によりトリガされるリカバリの期間中に伝送の遅延又は復号失敗が発生するリスクが低減される。
時刻tから時刻tにかけて、タイル設定部12は、リカバリ用伝送領域R4(=伝送領域R1)を、タイル単位で(図10の例ではタイル2つずつ)漸進的に拡大する。新たな拡大部分に対応するタイルは、イントラタイルとして符号化される。時刻t10において、タイル設定部12は、ピクチャ内の全てのタイルが復号可能となったために、リカバリ用伝送領域R4を再設定する。伝送領域R1は、ピクチャ全体に相当する。こうした領域の漸進的な拡大を通じて、伝送帯域幅を圧迫することなく、映像の途中から、全てのタイルの画像の正常な復号/再生を開始することができる。
中途再生のケースでは、パケット欠損のケースと異なり、一部のタイルではなくピクチャ内の全てのタイルが一旦復号不能と同様の状態になり得る。そこで、一変形例において、タイル設定部12は、パケット欠損からのリカバリのための第1のリカバリ用伝送領域と、中途再生時のリカバリのための第2のリカバリ用伝送領域とを画像へ設定してもよい。この場合の第2のリカバリ用伝送領域は、第1のリカバリ用伝送領域よりも小さい。
伝送制御部17は、復号装置60へ伝送されるパケットが欠損した場合には、第1のリカバリ用伝送領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように伝送を制限する。第1のリカバリ用伝送領域に含まれるタイルのうち符号化情報の欠損に起因して復号不能となった一部のタイルは、リカバリ期間中にイントラタイルとして符号化される。また、伝送制御部17は、映像の中途再生が要求された場合には、第2のリカバリ用伝送領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように伝送を制限する。第2のリカバリ用伝送領域に含まれるタイルは、符号化情報の不在に起因してその全てが復号不能となるはずであり、それらタイルの全てがリカバリ期間中に少なくとも一度イントラタイルとして符号化される。こうした複数のリカバリ用伝送領域を併用することで、リカバリをトリガする事象の種類に依存する柔軟な符号量の制御が可能となり、リカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクを一層低減することができる。
(2)シーン変化
図11は、シーン変化時のリカバリの一例について説明するための説明図である。図11の例では、時刻tの時点では通常の伝送が行われている。そして、伝送制御部17は、時刻tにおいて、動的な映像の解析に基づいて、シーン変化が生じたと判定する。シーン変化が生じた場合、その後のピクチャにおいてフレーム間予測による符号化利得は得られないため、ピクチャ内の全てのタイルを少なくとも一度イントラタイルとして符号化することが望ましい。そこで、時刻tにおいて、伝送制御部17は、伝送領域R1をリカバリ用伝送領域R5に一致するように縮小し、リカバリ用伝送領域R5内の2個のタイルに対応する符号化ストリームのみが伝送される。タイル設定部12は、リカバリ用伝送領域R5内のタイルをイントラタイルに設定する。伝送領域を縮小することにより、イントラタイルから生じる符号化ストリームのためにより多くの帯域幅を割り当てることが可能となるため、シーン変化によりトリガされるリカバリの期間中に伝送の遅延又は復号失敗が発生するリスクが低減される。
時刻tから時刻tにかけて、タイル設定部12は、リカバリ用伝送領域R5(=伝送領域R1)を、タイル単位で漸進的に拡大する。新たな拡大部分に対応するタイルは、イントラタイルとして符号化される。時刻t10において、タイル設定部12は、ピクチャ内の全てのタイルが復号可能となったために、リカバリ用伝送領域R5を再設定する。伝送領域R1は、ピクチャ全体に相当する。
<4.符号化時の処理の流れ>
(1)伝送制御処理
図12は、一実施形態に係る符号化側の伝送制御処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、符号化装置10により実行される処理ステップのうち本開示に係る技術の要旨に直接的に関連しないものは、図から省略されている。
まず、タイル設定部12は、画像をどのように複数のタイルへと分割するか、即ちタイル分割の態様を決定する(ステップS5)。次に、タイル設定部12は、後に詳細に説明する領域設定処理を実行することにより、複数のタイルのうちの1つ以上を含む部分領域であるリカバリ用伝送領域を画像へ設定する(ステップS10)。なお、図12ではタイル分割の決定の後に、リカバリ用伝送領域が画像に設定される例が示されている。しかしながら、かかる例に限定されず、所望のリカバリ用伝送領域を示す領域情報が取得された後に、その所望の領域にフィットするようにタイル分割が決定されてもよい。
次に、可逆符号化部16は、ピクチャ内のタイルの各々について量子化データを符号化することにより符号化ストリームを生成し、さらに少なくともタイル情報を含む符号化パラメータを符号化ストリームへ挿入する(ステップS20)。復号装置60から符号化ストリームの伝送が未だ要求されていない場合、符号化ストリームは伝送されない。伝送が既に開始済みであり、又は新たな伝送要求が受信された場合には(ステップS25)、フローチャートはステップS30へと進む。
ステップS30において、伝送制御部17は、中途再生の開始が要求されたか否かを判定する(ステップS30)。中途再生の開始が要求された場合、フローチャートは、後に詳細に説明するステップS50での領域リフレッシュ処理へと進む。中途再生の開始が要求されていない場合、伝送制御部17は、伝送領域内の1つ以上のタイルに対応する符号化ストリームを復号装置60へと伝送する(ステップS35)。次に、伝送制御部17は、例えば解析に基づいて、次に符号化しようとするピクチャにおいてシーン変化が生じたかを判定する(ステップS40)。シーン変化が生じたと判定される場合にも、フローチャートは、領域リフレッシュ処理へと進む。シーン変化が生じていない場合、伝送制御部17は、パケット欠損の発生を監視する(ステップS55)。ここでパケット欠損が検出された場合、フローチャートは、後に詳細に説明するステップS60でのタイルリフレッシュ処理へと進む。パケット欠損が検出されなかった場合であって、リカバリ期間中ではないときは、フローチャートはステップS20へ戻り、次のピクチャについてタイルごとの符号化及び伝送が繰り返される。一方、リカバリ期間中である場合、フローチャートは、後に詳細に説明するステップS80での領域拡大処理へと進む。
領域リフレッシュ処理(ステップS50)、タイルリフレッシュ処理(ステップS60)又は領域拡大処理(ステップS80)が終了すると、フローチャートはステップS20へ戻り、次のピクチャについてタイルごとの符号化及び伝送が繰り返される。図12には示していないものの、タイル分割又はリカバリ用伝送領域を変更しようとする場合には、ステップS5又はステップS10が再度実行されてもよい。
(2)領域設定処理
図13Aは、図12に示した領域設定処理の詳細な流れの第1の例を示すフローチャートである。第1の例において、まず、タイル設定部12は、予め定義され若しくはユーザにより入力される領域情報に基づいて、又は映像の解析に基づいて、リカバリ用伝送領域を設定する(ステップS12)。次に、タイル設定部12は、伝送領域をピクチャ全体に設定する(ステップS16)。次に、タイル設定部12は、リカバリ用伝送領域に含まれる全てのタイルについて、動き補償のためのタイル外参照を禁止に設定する(ステップS18)。リカバリ用伝送領域外のタイルについては、タイル設定部12は、タイル外参照を許可してもよく、又は禁止してもよい。
図13Bは、図12に示した領域設定処理の詳細な流れの第2の例を示すフローチャートである。第2の例において、まず、伝送制御部17は、復号装置60から領域情報を受信する(ステップS13)。次に、タイル設定部12は、伝送制御部17により受信された領域情報に基づいて、リカバリ用伝送領域を設定する(ステップS14)。次に、タイル設定部12は、伝送領域をピクチャ全体に設定する(ステップS16)。次に、タイル設定部12は、リカバリ用伝送領域に含まれる全てのタイルについて、動き補償のためのタイル外参照を禁止に設定する(ステップS18)。
(3)領域リフレッシュ処理
図14は、図12に示した領域リフレッシュ処理の詳細な流れの一例を示すフローチャートである。領域リフレッシュ処理において、まず、伝送制御部17は、伝送領域をリカバリ用伝送領域へと設定(即ち、縮小)する(ステップS52)。タイル設定部12は、縮小された伝送領域内の全てのタイルの次ピクチャでの予測符号化モードを、イントラ予測に設定する(ステップS54)。それにより、リカバリ用伝送領域に等しい伝送領域内の全てのタイルがイントラタイルとして符号化されることになる。
(4)タイルリフレッシュ処理
図15は、図12に示したタイルリフレッシュ処理の詳細な流れの一例を示すフローチャートである。タイルリフレッシュ処理において、まず、伝送制御部17は、伝送領域をリカバリ用伝送領域へと設定(即ち、縮小)する(ステップS62)。また、タイル設定部12は、パケット欠損に起因してどのタイルが復号不能となったかを判定する(ステップS64)。そして、タイル設定部12は、伝送領域内に復号不能となったタイルが存在するか否かを判定する(ステップS66)。伝送領域内に復号不能となったタイルが存在する場合、タイル設定部12は、その復号不能タイルの次ピクチャでの予測符号化モードを、イントラ予測に設定する(ステップS68)。それにより、復号不能タイルがイントラタイルとして符号化されることになる。
(5)領域拡大処理
図16Aは、図12に示した領域拡大処理の詳細な流れの第1の例を示すフローチャートである。第1の例において、まず、タイル設定部12は、伝送領域がピクチャ全体に等しいか否かを判定する(ステップS82)。この判定はリカバリ期間中に行われるため、ここでの伝送領域はリカバリ用伝送領域に等しい。前のピクチャまでの領域拡大処理を通じて伝送領域がピクチャ全体にまで拡大された場合、ステップS82において肯定的な判定結果が得られる。リカバリ期間中であって、伝送領域がピクチャ全体にまで未だ拡大されていない場合には、否定的な判定結果が得られる。
伝送領域がピクチャ全体に等しくない場合、タイル設定部12は、リカバリ用伝送領域に追加する1つ以上のタイルを選択する(ステップS84)。次に、タイル設定部12は、選択したタイルをリカバリ用伝送領域に追加する(ステップS86)。また、タイル設定部12は、伝送領域を拡大後のリカバリ用伝送領域に設定する(ステップS88)。また、タイル設定部12は、追加したタイルの次ピクチャでの予測符号化モードを、イントラ予測に設定する(ステップS90)。
伝送領域がピクチャ全体に等しい場合、タイル設定部12は、リカバリ用伝送領域を再設定する(ステップS92)。ここで再設定されるリカバリ用伝送領域は、リカバリ期間の前に設定されていたリカバリ用伝送領域と同じであってもよく又は異なってもよい。また、タイル設定部12は、伝送領域をピクチャ全体に設定する(ステップS94)。
最後に、タイル設定部12は、(拡大後又は再設定後の)リカバリ用伝送領域内のタイルのタイル外参照を禁止に設定する(ステップS96)。
図16Bは、図12に示した領域拡大処理の詳細な流れの第2の例を示すフローチャートである。第2の例においても、まず、タイル設定部12は、伝送領域がピクチャ全体に等しいか否かを判定する(ステップS82)。
伝送領域がピクチャ全体に等しくない場合、タイル設定部12は、伝送帯域幅の利用可能性を判定する(ステップS83)。ここで、新たにイントラタイルを符号化するために十分な伝送帯域幅が残されていないと判定される場合には、その後のステップS85からステップS96までの処理ステップはスキップされ、このタイミングで伝送領域は拡大されない。新たにイントラタイルを符号化するために十分な伝送帯域幅が利用可能である場合、タイル設定部12は、利用可能な帯域幅に基づいて、リカバリ用伝送領域に追加する1つ以上のタイルを選択する(ステップS85)。次に、タイル設定部12は、選択したタイルをリカバリ用伝送領域に追加する(ステップS86)。また、タイル設定部12は、伝送領域を拡大後のリカバリ用伝送領域に設定する(ステップS88)。また、タイル設定部12は、追加したタイルの次ピクチャでの予測符号化モードを、イントラ予測に設定する(ステップS90)。
伝送領域がピクチャ全体に等しい場合、タイル設定部12は、リカバリ用伝送領域を再設定する(ステップS92)。ここで再設定されるリカバリ用伝送領域は、リカバリ期間の前に設定されていたリカバリ用伝送領域と同じであってもよく又は異なってもよい。また、タイル設定部12は、伝送領域をピクチャ全体に設定する(ステップS94)。
最後に、タイル設定部12は、リカバリ用伝送領域が拡大され又は再設定された場合、リカバリ用伝送領域内のタイルのタイル外参照を禁止に設定する(ステップS96)。
<5.復号装置の構成>
図17は、復号装置60の構成の一例を示すブロック図である。図17を参照すると、復号装置60は、伝送制御部61、可逆復号部62、逆量子化部63、逆直交変換部64、加算部65、デブロックフィルタ66、SAOフィルタ67、並び替えバッファ68、再生制御部69、フレームメモリ70、セレクタ71a及び71b、イントラ予測部80並びにインター予測部90を備える。
伝送制御部61は、ネットワーク5を介する符号化装置10からの符号化ストリームの受信を制御する。伝送制御部61は、例えば、再生制御部69へのユーザ入力に応じて、映像コンテンツの符号化ストリームの伝送を求める伝送要求を符号化装置10へ送信する。そして、伝送が開始されると、伝送制御部61は、符号化装置10から順次受信される符号化ストリームを、可逆復号部62へ出力する。伝送制御部61は、受信されるパケットについて、例えばシーケンス番号の検証又は誤り検出といった何らかの欠損検出を実行し、パケットの欠損に起因して必要とされる符号化情報が欠損したことを検出した場合には、欠損したパケットを特定するメッセージを符号化装置10へシグナリングする。伝送制御部61は、パケットを特定するメッセージの代わりに、復号不能となったタイルを特定するメッセージをシグナリングしてもよい。映像の符号化ストリームは、通常時には、ピクチャ内の複数のタイルの全てに対応するストリームを含むが、上述したメッセージの送信後のリカバリ期間中には、リカバリ用伝送領域に含まれるタイルに対応するストリームのみを含む。
リカバリ用伝送領域は図6A及び図6Bを用いて説明したように符号化装置10において決定されてもよく、又は図6Cを用いて説明したように復号装置60において決定されてもよい。後者の場合、例えば、映像を視聴するユーザが、安定的な映像の再生が求められる部分領域をユーザインタフェースを介して指定する。伝送制御部61は、ユーザにより指定された部分領域に関する領域情報を生成し、生成した領域情報を映像の伝送元である符号化装置10へ提供する。そして、符号化装置10において、当該領域情報に基づいてリカバリ用伝送領域が設定される。リカバリ用伝送領域に含まれるタイルについては、上述したように、動き補償のためのタイル外参照が禁止される。
伝送要求は、映像コンテンツの冒頭からの再生のための通常の要求であってもよく、又は映像コンテンツの中途からの再生のための中途再生要求であってもよい。映像コンテンツの中途からの再生のための中途再生要求を伝送制御部61が送信した場合、当該要求に応じて開始される伝送は通常の伝送ではなくリカバリのための伝送となり、受信される符号化ストリームは、リカバリ期間が終了するまで、リカバリ用伝送領域に含まれるタイルに対応するストリームのみを含む。
可逆復号部62は、映像コンテンツの復号のために、伝送制御部61から入力される各タイルに対応する符号化ストリームから、各タイルの量子化データを復号する。また、可逆復号部62は、符号化ストリームに挿入されている情報を復号する。可逆復号部62により復号される情報は、例えば、タイル情報、イントラ予測に関する情報、及びインター予測に関する情報を含み得る。可逆復号部62は、量子化データを逆量子化部63へ出力する。また、可逆復号部62は、タイル情報を再生制御部69へ、イントラ予測に関する情報をイントラ予測部80へ、インター予測に関する情報をインター予測部90へそれぞれ出力する。
逆量子化部63は、可逆復号部62から入力される量子化データを、符号化の際に使用されたものと同じ量子化ステップで逆量子化し、変換係数データを復元する。逆量子化部63は、復元した変換係数データを逆直交変換部64へ出力する。
逆直交変換部64は、符号化の際に使用された直交変換方式に従い、逆量子化部63から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。逆直交変換部64は、生成した予測誤差データを加算部65へ出力する。
加算部65は、逆直交変換部64から入力される予測誤差データと、セレクタ71bから入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部65は、生成した復号画像データをデブロックフィルタ66及びフレームメモリ70へ出力する。
デブロックフィルタ66は、加算部65から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをSAOフィルタ67へ出力する。
SAOフィルタ67は、デブロックフィルタ66から入力される復号画像データにエッジオフセット処理又はバンドオフセット処理を適用することによりノイズを除去し、処理後の復号画像データを並び替えバッファ68及びフレームメモリ70へ出力する。
並び替えバッファ68は、SAOフィルタ67から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ68は、生成した画像データを再生制御部69へ出力する。
再生制御部69は、並び替えバッファ68から入力される画像データに基づく映像の再生を制御する。再生制御部69は、例えば、画像データを映像出力用の画像信号に変換し、変換した画像信号をディスプレイ(図示せず)へ出力する。
再生制御部69は、符号化情報の欠損又は不在の検出後のリカバリ期間中において、部分的に復号されるリカバリ用伝送領域の画像を、フレームサイズに適合するようにスケーリングした後にディスプレイに表示させてもよい。図18の例では、ピクチャP5のリカバリ用伝送領域R2aの画像がフレームサイズに適合するように拡大された様子が、図中の右に示されている。
復号されるタイルのうちのどのタイルを表示すべきかは、符号化側で決定され、表1を用いて説明したフラグdisplay_tile_set_flag[i]を用いて復号側へとシグナリングされてもよい。その代わりに、再生制御部69が、復号された画像の形状を判定し、表示画像が矩形となるように一部のタイルの表示をスキップしてもよい。また、再生制御部69は、リカバリ期間中であることをユーザに通知するための表示オブジェクトを、映像が表示されない部分に重畳してもよい。図19の例では、非矩形のリカバリ用伝送領域R2bを有するピクチャP6のうちの矩形部分のみの再生画像と、リカバリ期間中であることをユーザに通知するためのメッセージとを含む表示画像が、図中の右に示されている。
フレームメモリ70は、加算部65から入力されるフィルタリング前の復号画像データ、及びSAOフィルタ67から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。
セレクタ71aは、可逆復号部62により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ70からの画像データの出力先をイントラ予測部80とインター予測部90との間で切り替える。例えば、セレクタ71aは、イントラ予測モードが指定された場合には、フレームメモリ70から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部80へ出力する。また、セレクタ71aは、インター予測モードが指定された場合には、フィルタリング後の復号画像データを参照画像データとしてインター予測部90へ出力する。
セレクタ71bは、可逆復号部62により取得されるモード情報に応じて、加算部65へ供給すべき予測画像データの出力元をイントラ予測部80とインター予測部90との間で切り替える。例えば、セレクタ71bは、イントラ予測モードが指定された場合には、イントラ予測部80から出力される予測画像データを加算部65へ供給する。また、セレクタ71bは、インター予測モードが指定された場合には、インター予測部90から出力される予測画像データを加算部65へ供給する。
リカバリ用伝送領域内のタイルであって、符号化情報の欠損又は不在に起因して復号不能となった当該タイルは、リカバリ期間中に少なくとも一度イントラタイルとして符号化され、その対応する符号化ストリームが符号化装置10から受信される。イントラタイルにおいてはフレーム間予測は行われず、イントラ予測部80により予測画像データが生成される。
イントラ予測部80は、可逆復号部62から入力されるイントラ予測に関する情報とフレームメモリ70からの参照画像データとに基づいてイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部80は、生成した予測画像データをセレクタ71bへ出力する。
インター予測部90は、可逆復号部62から入力されるインター予測に関する情報とフレームメモリ70からの参照画像データとに基づいてインター予測処理を行い、予測画像データを生成する。そして、インター予測部90は、生成した予測画像データをセレクタ71bへ出力する。
<6.復号時の処理の流れ>
図20は、一実施形態に係る復号側の伝送制御処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、復号装置60により実行される処理ステップのうち本開示に係る技術の要旨に直接的に関連しないものは、図から省略されている。
まず、伝送制御部61は、例えばユーザにより指定されたリカバリ用伝送領域に関する領域情報を、映像の伝送元である符号化装置10へ送信する(ステップS110)。本ステップは、符号化側でリカバリ用伝送領域が決定される場合には省略されてよい。
次に、伝送制御部61は、映像コンテンツの符号化ストリームの伝送を求める伝送要求を符号化装置10へ送信する(ステップS120)。ここでは、典型的には、リアルタイムで又は少なくとも低遅延での映像コンテンツの伝送が要求される。ここで送信される伝送要求に応じて符号化ストリームの伝送が開始されると、その後のステップS130からステップS170までの処理ステップはピクチャごとに繰り返される。
ピクチャごとの各繰り返しにおいて、伝送制御部61は、その時点で設定されている伝送領域に含まれる1つ以上のタイルに対応する符号化ストリームを受信する(ステップS130)。
次に、可逆復号部62での量子化データの復号、逆量子化部63での変換係数データの逆量子化、逆直交変換部64での予測誤差データの生成、及び予測画像データと予測誤差データとの加算などを通じて、符号化ストリームからタイルの各々の画像が復号される(ステップS140)。
次に、再生制御部69は、画像全体が復号されたか又は部分画像のみが復号されたかを判定する(ステップS150)。再生制御部69は、部分画像のみが復号された場合には、部分画像を表示サイズに合わせてスケーリングする(ステップS160)。そして、再生制御部69は、画像信号をディスプレイへ出力することにより、映像を再生する(ステップS170)。
<7.ハードウェア構成例>
上述した実施形態は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。符号化装置10又は復号装置60がソフトウェアを使用する場合、ソフトウェアを構成するプログラムは、例えば、装置の内部又は外部に設けられる記憶媒体(非一時的な媒体:non-transitory media)に予め格納される。そして、各プログラムは、例えば、実行時にRAM(Random Access Memory)に読み込まれ、CPU(Central Processing Unit)などのプロセッサにより実行される。
図21は、上述した実施形態を適用可能な装置のハードウェア構成の一例を示すブロック図である。図21を参照すると、画像処理装置800は、システムバス810、画像処理チップ820及びオフチップメモリ890を備える。画像処理チップ820は、n個(nは1以上)の処理回路830−1、830−2、…、830−n、参照バッファ840、システムバスインタフェース850及びローカルバスインタフェース860を含む。
システムバス810は、画像処理チップ820と外部モジュール(例えば、中央制御機能、アプリケーション機能、通信インタフェース又はユーザインタフェースなど)との間の通信路を提供する。処理回路830−1、830−2、…、830−nは、システムバスインタフェース850を介してシステムバス810と接続され、及びローカルバスインタフェース860を介してオフチップメモリ890と接続される。処理回路830−1、830−2、…、830−nは、オンチップメモリ(例えば、SRAM)に相当し得る参照バッファ840にもアクセスすることができる。オフチップメモリ890は、例えば、画像処理チップ820により処理される画像データを記憶するフレームメモリであってよい。一例として、処理回路830−1及び830−2は、タイルごとに並列的に実行される符号化処理又は復号処理のために利用され得る。なお、これら処理回路は、同一の画像処理チップ820ではなく、別個のチップ上に形成されてもよい。画像処理装置800は、符号化装置10若しくは復号装置60自体であってもよく、これら装置に搭載される一モジュールであってもよい。
<8.応用例>
上述した実施形態に係る符号化装置10及び復号装置60は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
(1)第1の応用例
図22は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース909、制御部910、ユーザインタフェース911、及びバス912を備える。
チューナ902は、アンテナ901を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ902は、復調により得られた符号化ビットストリームをデマルチプレクサ903へ出力する。即ち、チューナ902は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、デマルチプレクサ903は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に映像を表示させる。また、映像信号処理部905は、ネットワークを介して供給されるアプリケーション画面を表示部906に表示させてもよい。また、映像信号処理部905は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、生成した画像を出力画像に重畳してもよい。
表示部906は、映像信号処理部905から供給される駆動信号により駆動され、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOLEDなど)の映像面上に映像又は画像を表示する。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、音声データについてノイズ除去などの追加的な処理を行ってもよい。
外部インタフェース909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース909を介して受信される映像ストリーム又は音声ストリームが、デコーダ904により復号されてもよい。即ち、外部インタフェース909もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
制御部910は、CPU(Central Processing Unit)などのプロセッサ、並びにRAM(Random Access Memory)及びROM(Read Only Memory)などのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置900の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース911から入力される操作信号に応じて、テレビジョン装置900の動作を制御する。
ユーザインタフェース911は、制御部910と接続される。ユーザインタフェース911は、例えば、ユーザがテレビジョン装置900を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース911は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部910へ出力する。
バス912は、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、音声信号処理部907、外部インタフェース909及び制御部910を相互に接続する。
このように構成されたテレビジョン装置900において、デコーダ904は、上述した実施形態に係る復号装置60の機能を有する。従って、テレビジョン装置900において、映像を復号するために必要とされる符号化情報の欠損又は不在の後のリカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクは低減される。
(2)第2の応用例
図23は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
アンテナ921は、通信部922に接続される。スピーカ924及びマイクロホン925は、音声コーデック923に接続される。操作部932は、制御部931に接続される。バス933は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、及び制御部931を相互に接続する。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。
音声通話モードにおいて、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック923は、圧縮後の音声データを通信部922へ出力する。通信部922は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック923へ出力する。音声コーデック923は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
また、データ通信モードにおいて、例えば、制御部931は、操作部932を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部931は、文字を表示部930に表示させる。また、制御部931は、操作部932を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部922へ出力する。通信部922は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部931へ出力する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929の記憶媒体に記憶させる。
記録再生部929は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。
また、撮影モードにおいて、例えば、カメラ部926は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部927へ出力する。画像処理部927は、カメラ部926から入力される画像データを符号化し、符号化ストリームを記録再生部929の記憶媒体に記憶させる。
また、テレビ電話モードにおいて、例えば、多重分離部928は、画像処理部927により符号化された映像ストリームと、音声コーデック923から入力される音声ストリームとを多重化し、多重化したストリームを通信部922へ出力する。通信部922は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部922は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部928へ出力する。多重分離部928は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部927、音声ストリームを音声コーデック923へ出力する。画像処理部927は、映像ストリームを復号し、映像データを生成する。映像データは、表示部930に供給され、表示部930により一連の画像が表示される。音声コーデック923は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
このように構成された携帯電話機920において、画像処理部927は、上述した実施形態に係る符号化装置10及び復号装置60の機能を有する。従って、携帯電話機920は、符号化情報の欠損又は不在の後のリカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクを低減することができる。
(3)第3の応用例
図24は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データ及び映像データを復号する。
記録再生装置940は、チューナ941、外部インタフェース942、エンコーダ943、HDD(Hard Disk Drive)944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)948、制御部949、及びユーザインタフェース950を備える。
チューナ941は、アンテナ(図示せず)を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ941は、復調により得られた符号化ビットストリームをセレクタ946へ出力する。即ち、チューナ941は、記録再生装置940における伝送手段としての役割を有する。
外部インタフェース942は、記録再生装置940と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース942は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース942を介して受信される映像データ及び音声データは、エンコーダ943へ入力される。即ち、外部インタフェース942は、記録再生装置940における伝送手段としての役割を有する。
エンコーダ943は、外部インタフェース942から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ943は、符号化ビットストリームをセレクタ946へ出力する。
HDD944は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD944は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。
ディスクドライブ945は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ945に装着される記録媒体は、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)又はBlu−ray(登録商標)ディスクなどであってよい。
セレクタ946は、映像及び音声の記録時には、チューナ941又はエンコーダ943から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD944又はディスクドライブ945へ出力する。また、セレクタ946は、映像及び音声の再生時には、HDD944又はディスクドライブ945から入力される符号化ビットストリームをデコーダ947へ出力する。
デコーダ947は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ947は、生成した映像データをOSD948へ出力する。また、デコーダ904は、生成した音声データを外部のスピーカへ出力する。
OSD948は、デコーダ947から入力される映像データを再生し、映像を表示する。また、OSD948は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。
制御部949は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置940の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース950から入力される操作信号に応じて、記録再生装置940の動作を制御する。
ユーザインタフェース950は、制御部949と接続される。ユーザインタフェース950は、例えば、ユーザが記録再生装置940を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース950は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部949へ出力する。
このように構成された記録再生装置940において、エンコーダ943は、上述した実施形態に係る符号化装置10の機能を有する。また、デコーダ947は、上述した実施形態に係る復号装置60の機能を有する。従って、記録再生装置940は、符号化情報の欠損又は不在の後のリカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクを低減することができる。
(4)第4の応用例
図25は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、信号処理部963、画像処理部964、表示部965、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、制御部970、ユーザインタフェース971、及びバス972を備える。
光学ブロック961は、撮像部962に接続される。撮像部962は、信号処理部963に接続される。表示部965は、画像処理部964に接続される。ユーザインタフェース971は、制御部970に接続される。バス972は、画像処理部964、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、及び制御部970を相互に接続する。
光学ブロック961は、フォーカスレンズ及び絞り機構などを有する。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCD又はCMOSなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部962は、画像信号を信号処理部963へ出力する。
信号処理部963は、撮像部962から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部963は、カメラ信号処理後の画像データを画像処理部964へ出力する。
画像処理部964は、信号処理部963から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部964は、生成した符号化データを外部インタフェース966又はメディアドライブ968へ出力する。また、画像処理部964は、外部インタフェース966又はメディアドライブ968から入力される符号化データを復号し、画像データを生成する。そして、画像処理部964は、生成した画像データを表示部965へ出力する。また、画像処理部964は、信号処理部963から入力される画像データを表示部965へ出力して画像を表示させてもよい。また、画像処理部964は、OSD969から取得される表示用データを、表示部965へ出力する画像に重畳してもよい。
OSD969は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部964へ出力する。
外部インタフェース966は、例えばUSB入出力端子として構成される。外部インタフェース966は、例えば、画像の印刷時に、撮像装置960とプリンタとを接続する。また、外部インタフェース966には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置960にインストールされ得る。さらに、外部インタフェース966は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース966は、撮像装置960における伝送手段としての役割を有する。
メディアドライブ968に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ968に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD(Solid State Drive)のような非可搬性の記憶部が構成されてもよい。
制御部970は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置960の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース971から入力される操作信号に応じて、撮像装置960の動作を制御する。
ユーザインタフェース971は、制御部970と接続される。ユーザインタフェース971は、例えば、ユーザが撮像装置960を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース971は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部970へ出力する。
このように構成された撮像装置960において、画像処理部964は、上述した実施形態に係る符号化装置10及び復号装置60の機能を有する。従って、撮像装置960は、符号化情報の欠損又は不在の後のリカバリ期間中に伝送の遅延又は再度の復号失敗が発生するリスクを低減することができる。
<9.まとめ>
ここまで、図1〜図25を用いて、本開示に係る技術の実施形態について詳細に説明した。上述した実施形態によれば、符号化すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域が画像へ設定され、当該部分領域に含まれるタイルについて動き補償のためのタイル外参照が禁止に設定される。そして、復号装置へ映像の符号化ストリームが伝送される場合に、復号側での符号化情報の欠損又は不在の検出後に、上記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように伝送が制限される。即ち、リカバリを要する状況において伝送領域が一時的に画像全体ではなく上記部分領域に縮小されるため、イントラタイルを用いたリフレッシュのために利用可能な帯域幅を増やして、伝送の遅延又は再度の復号失敗が発生するリスクを低減することができる。また、上記部分領域内ではタイル間でエラーが伝播しないため、リカバリ期間中の継続的かつ安定的な映像コンテンツの復号及び再生が保証される。さらに、こうした仕組みを実装するにあたって、タイル単位の並列処理の目的で設計された参照関係の制御のためのパラメータ群を活用することができるため、そうしたパラメータ群の用意されていないスライスを用いる手法と比較して、簡易な実装が可能である。
また、上述した実施形態によれば、上記部分領域内のタイルであって、符号化情報の欠損又は不在に起因して復号不能となった当該タイルはイントラタイルとして符号化され、そのイントラタイルに対応する符号化ストリームがリカバリ期間中に伝送される。符号化情報の欠損又は不在の影響は、タイル外参照の禁止の帰結として、情報が直接的に失われたタイルのみに局所化される。イントラタイルとして符号化すべき領域がこのように小さい領域であれば、イントラタイルを用いたリフレッシュにより生じる符号量の増加も抑制される。
また、上述した実施形態によれば、伝送が部分的な伝送領域に制限されているリカバリ期間中に、その伝送領域がタイル単位で漸進的に拡大し、部分領域の新たな拡大部分に対応するタイルがイントラタイルとして符号化される。従って、ネットワーク帯域幅が限られているとしても、当初の部分領域内の安定的な映像コンテンツの再生を確保しながら、時間の経過と共に画像全体のリカバリを達成することができる。また、伝送が制限されている期間中に、伝送帯域幅の利用可能性に基づいて決定される任意のタイミングで上記部分領域を拡大することが可能である。そのため、例えば絵柄の変動に起因する符号量の増加とイントラタイルの使用に起因する符号量の増加とが同時に発生して、リアルタイム性が失われ又は画質が低下するような事態も避けられる。
また、一例として、リカバリ期間中に復号可能な部分領域が矩形ではない場合に、標準的なパラメータを用いて、復号側で画像が矩形で表示されるようにエンコーダにおいてタイルごとの表示又は非表示を設定することができる。この場合、デコーダは、標準仕様において規定された通りに動作するだけで、矩形の自然な映像を再生することができる。
また、上述した実施形態によれば、上記部分領域は、ユーザレベル又はアプリケーションレベルで注目すべき領域として、予め定義され、(符号化側若しくは復号側のいずれかで)ユーザにより入力され、又は映像の解析に基づいて設定され得る。従って、ネットワーク帯域幅が限られている状況において、パケット欠損等の事象が生じたとしても、注目すべき領域を優先して安定的な映像を提供することができる。
なお、本明細書では、HEVCにおいて使用されている標準的な用語に従って「タイル」との語を用いたが、本開示に係る技術の範囲は、その要旨に関係しない語の意味によっては限定されない。将来的な標準化又はその他の取り決めに依存して、「タイル」の代わりに、ピクチャよりも小さい小領域であって、領域間の参照関係の制御の可能な小領域を意味する他の語が使用されてもよい。
また、本明細書では、タイル情報が、符号化ストリームへ挿入されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的又は例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果と共に、又は上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏し得る。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
符号化すべき映像に含まれる画像の各々を複数のタイルへと分割し、前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定する設定部と、
各画像をタイルごとに符号化して符号化ストリームを生成する符号化部と、
前記映像を復号する復号装置への前記符号化ストリームの伝送を制御する伝送制御部と、
を備え、
前記設定部は、前記部分領域に含まれるタイルについて動き補償のためのタイル外参照を禁止に設定し、
前記伝送制御部は、前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送を制限する、
符号化装置。
(2)
前記符号化部は、前記部分領域内のタイルであって、符号化情報の前記欠損又は前記不在に起因して復号不能となった当該タイルをイントラタイルとして符号化し、
前記イントラタイルに対応する符号化ストリームは、前記伝送制御部により前記伝送が制限されている期間中に前記復号装置へ伝送される、
前記(1)に記載の符号化装置。
(3)
前記設定部は、前記伝送制御部により前記伝送が制限されている期間中に、前記部分領域をタイル単位で漸進的に拡大し、
前記符号化部は、前記部分領域の新たな拡大部分に対応するタイルをイントラタイルとして符号化する、
前記(1)又は前記(2)に記載の符号化装置。
(4)
符号化情報の前記欠損又は前記不在に起因して復号不能となった前記部分領域外のタイルは、前記部分領域の前記漸進的な拡大を通じて復号可能となる、前記(3)に記載の符号化装置。
(5)
前記設定部は、前記部分領域の前記漸進的な拡大を通じて全てのタイルが復号可能となった後に、前記部分領域を再設定する、前記(3)又は前記(4)に記載の符号化装置。(6)
前記設定部は、前記伝送制御部により前記伝送が制限されている期間中に、伝送帯域幅の利用可能性に基づいて動的に決定されるタイミングで、前記部分領域を拡大する、前記(3)〜(5)のいずれか1項に記載の符号化装置。
(7)
前記設定部は、前記部分領域が矩形ではない場合に、前記復号装置により復号される画像が矩形で表示されるように、タイルごとの表示又は非表示を設定する、前記(3)〜(6)のいずれか1項に記載の符号化装置。
(8)
前記設定部は、予め定義され若しくはユーザにより入力される領域情報に基づいて、又は前記映像の解析に基づいて、前記部分領域を前記画像へ設定する、前記(1)〜(7)のいずれか1項に記載の符号化装置。
(9)
前記設定部は、前記復号装置から受信される領域情報に基づいて、前記部分領域を前記画像へ設定する、前記(1)〜(7)のいずれか1項に記載の符号化装置。
(10)
前記伝送制御部は、前記復号装置へ伝送されるパケットが欠損した場合に、必要とされる符号化情報の前記欠損を検出する、前記(1)〜(9)のいずれか1項に記載の符号化装置。
(11)
前記伝送制御部は、前記映像の中途再生が要求された場合に、必要とされる符号化情報の前記不在を検出する、前記(1)〜(9)のいずれか1項に記載の符号化装置。
(12)
前記伝送制御部は、前記映像の解析に基づいてシーン変化が生じたと判定された場合にも、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送を制限する、前記(1)〜(11)のいずれか1項に記載の符号化装置。
(13)
前記設定部は、第1の部分領域及び当該第1の部分領域よりも小さい第2の部分領域を前記画像へ設定し、
前記伝送制御部は、前記復号装置へ伝送されるパケットが欠損した場合に、前記第1の部分領域に含まれるタイルに対応する符号化ストリームのみが伝送され、前記映像の中途再生が要求された場合に、前記第2の部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように、前記伝送を制限する、
前記(1)〜(12)のいずれか1項に記載の符号化装置。
(14)
前記符号化部は、HEVC(High Efficiency Video Coding)方式に従って各画像を符号化し、
前記部分領域に含まれるタイルについて動き補償のためのタイル外参照が禁止に設定されることを示すパラメータがSEI(Supplemental Enhancement Information)メッセージに含まれる、
前記(1)〜(13)のいずれか1項に記載の符号化装置。
(15)
符号化装置において復号装置への映像の伝送を制御する伝送制御方法であって、
符号化すべき映像に含まれる画像の各々を複数のタイルへと分割することと、
前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定することと、
各画像をタイルごとに符号化して符号化ストリームを生成することと、
前記復号装置への前記符号化ストリームの伝送を制御することと、
を含み、
前記部分領域に含まれるタイルについて動き補償のためのタイル外参照は禁止に設定され、
前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送が制限される、
伝送制御方法。
(16)
復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供する伝送制御部と、
前記符号化装置から受信される前記映像の符号化ストリームから前記映像を復号する復号部と、
を備え、
通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、
復号装置。
(17)
前記部分領域内のタイルであって、前記符号化情報の前記欠損又は前記不在に起因して復号不能となった当該タイルは、イントラタイルとして符号化され、
前記イントラタイルに対応するストリームは、前記符号化ストリームの伝送の対象が前記部分領域に制限されている期間中に、前記符号化装置から受信される、
前記(16)に記載の復号装置。
(18)
前記復号装置は、前記復号部により復号される前記映像の再生を制御する再生制御部、をさらに備え、
前記再生制御部は、前記符号化情報の前記欠損又は前記不在の検出後に部分的に復号される前記部分領域の画像を、フレームサイズに適合するようにスケーリングする、
前記(16)又は前記(17)に記載の復号装置。
(19)
復号装置において符号化装置からの映像の伝送を制御する伝送制御方法であって、
復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供することと、
前記符号化装置から前記映像の符号化ストリームを受信することと、
受信される前記符号化ストリームから前記映像を復号することと、
を含み、
通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、
伝送制御方法。
1 画像処理システム
10 符号化装置
12 タイル設定部
16 可逆符号化部
17 伝送制御部
60 復号装置
61 伝送制御部
62 可逆復号部
69 再生制御部

Claims (19)

  1. 符号化すべき映像に含まれる画像の各々を複数のタイルへと分割し、前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定する設定部と、
    各画像をタイルごとに符号化して符号化ストリームを生成する符号化部と、
    前記映像を復号する復号装置への前記符号化ストリームの伝送を制御する伝送制御部と、
    を備え、
    前記設定部は、前記部分領域に含まれるタイルについて動き補償のためのタイル外参照を禁止に設定し、
    前記伝送制御部は、前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送を制限する、
    符号化装置。
  2. 前記符号化部は、前記部分領域内のタイルであって、符号化情報の前記欠損又は前記不在に起因して復号不能となった当該タイルをイントラタイルとして符号化し、
    前記イントラタイルに対応する符号化ストリームは、前記伝送制御部により前記伝送が制限されている期間中に前記復号装置へ伝送される、
    請求項1に記載の符号化装置。
  3. 前記設定部は、前記伝送制御部により前記伝送が制限されている期間中に、前記部分領域をタイル単位で漸進的に拡大し、
    前記符号化部は、前記部分領域の新たな拡大部分に対応するタイルをイントラタイルとして符号化する、
    請求項1に記載の符号化装置。
  4. 符号化情報の前記欠損又は前記不在に起因して復号不能となった前記部分領域外のタイルは、前記部分領域の前記漸進的な拡大を通じて復号可能となる、請求項3に記載の符号化装置。
  5. 前記設定部は、前記部分領域の前記漸進的な拡大を通じて全てのタイルが復号可能となった後に、前記部分領域を再設定する、請求項3に記載の符号化装置。
  6. 前記設定部は、前記伝送制御部により前記伝送が制限されている期間中に、伝送帯域幅の利用可能性に基づいて動的に決定されるタイミングで、前記部分領域を拡大する、請求項3に記載の符号化装置。
  7. 前記設定部は、前記部分領域が矩形ではない場合に、前記復号装置により復号される画像が矩形で表示されるように、タイルごとの表示又は非表示を設定する、請求項3に記載の符号化装置。
  8. 前記設定部は、予め定義され若しくはユーザにより入力される領域情報に基づいて、又は前記映像の解析に基づいて、前記部分領域を前記画像へ設定する、請求項1に記載の符号化装置。
  9. 前記設定部は、前記復号装置から受信される領域情報に基づいて、前記部分領域を前記画像へ設定する、請求項1に記載の符号化装置。
  10. 前記伝送制御部は、前記復号装置へ伝送されるパケットが欠損した場合に、必要とされる符号化情報の前記欠損を検出する、請求項1に記載の符号化装置。
  11. 前記伝送制御部は、前記映像の中途再生が要求された場合に、必要とされる符号化情報の前記不在を検出する、請求項1に記載の符号化装置。
  12. 前記伝送制御部は、前記映像の解析に基づいてシーン変化が生じたと判定された場合にも、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送を制限する、請求項1に記載の符号化装置。
  13. 前記設定部は、第1の部分領域及び当該第1の部分領域よりも小さい第2の部分領域を前記画像へ設定し、
    前記伝送制御部は、前記復号装置へ伝送されるパケットが欠損した場合に、前記第1の部分領域に含まれるタイルに対応する符号化ストリームのみが伝送され、前記映像の中途再生が要求された場合に、前記第2の部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように、前記伝送を制限する、
    請求項1に記載の符号化装置。
  14. 前記符号化部は、HEVC(High Efficiency Video Coding)方式に従って各画像を符号化し、
    前記部分領域に含まれるタイルについて動き補償のためのタイル外参照が禁止に設定されることを示すパラメータがSEI(Supplemental Enhancement Information)メッセージに含まれる、
    請求項1に記載の符号化装置。
  15. 符号化装置において復号装置への映像の伝送を制御する伝送制御方法であって、
    符号化すべき映像に含まれる画像の各々を複数のタイルへと分割することと、
    前記複数のタイルのうちの1つ以上を含む部分領域を前記画像へ設定することと、
    各画像をタイルごとに符号化して符号化ストリームを生成することと、
    前記復号装置への前記符号化ストリームの伝送を制御することと、
    を含み、
    前記部分領域に含まれるタイルについて動き補償のためのタイル外参照は禁止に設定され、
    前記復号装置における符号化情報の欠損又は不在の検出後に、前記部分領域に含まれるタイルに対応する符号化ストリームのみが伝送されるように前記伝送が制限される、
    伝送制御方法。
  16. 復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供する伝送制御部と、
    前記符号化装置から受信される前記映像の符号化ストリームから前記映像を復号する復号部と、
    を備え、
    通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、
    復号装置。
  17. 前記部分領域内のタイルであって、前記符号化情報の前記欠損又は前記不在に起因して復号不能となった当該タイルは、イントラタイルとして符号化され、
    前記イントラタイルに対応するストリームは、前記符号化ストリームの伝送の対象が前記部分領域に制限されている期間中に、前記符号化装置から受信される、
    請求項16に記載の復号装置。
  18. 前記復号装置は、前記復号部により復号される前記映像の再生を制御する再生制御部、をさらに備え、
    前記再生制御部は、前記符号化情報の前記欠損又は前記不在の検出後に部分的に復号される前記部分領域の画像を、フレームサイズに適合するようにスケーリングする、
    請求項16に記載の復号装置。
  19. 復号装置において符号化装置からの映像の伝送を制御する伝送制御方法であって、
    復号すべき映像に含まれる画像の複数のタイルのうちの1つ以上を含む部分領域に関する領域情報を、前記映像の伝送元である符号化装置へ提供することと、
    前記符号化装置から前記映像の符号化ストリームを受信することと、
    受信される前記符号化ストリームから前記映像を復号することと、
    を含み、
    通常時には、前記複数のタイルの全てに対応する前記符号化ストリームが受信され、必要とされる符号化情報の欠損又は不在の検出後には、前記領域情報に基づいて設定される、動き補償のためのタイル外参照が禁止される前記部分領域に含まれるタイルに対応する前記符号化ストリームのみが受信される、
    伝送制御方法。
JP2017524670A 2015-06-24 2016-03-22 符号化装置、復号装置及び伝送制御方法 Active JP6642573B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015126486 2015-06-24
JP2015126486 2015-06-24
PCT/JP2016/058940 WO2016208241A1 (ja) 2015-06-24 2016-03-22 符号化装置、復号装置及び伝送制御方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019237263A Division JP6860061B2 (ja) 2015-06-24 2019-12-26 復号装置及び復号方法

Publications (2)

Publication Number Publication Date
JPWO2016208241A1 JPWO2016208241A1 (ja) 2018-04-19
JP6642573B2 true JP6642573B2 (ja) 2020-02-05

Family

ID=57585466

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017524670A Active JP6642573B2 (ja) 2015-06-24 2016-03-22 符号化装置、復号装置及び伝送制御方法
JP2019237263A Active JP6860061B2 (ja) 2015-06-24 2019-12-26 復号装置及び復号方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019237263A Active JP6860061B2 (ja) 2015-06-24 2019-12-26 復号装置及び復号方法

Country Status (4)

Country Link
US (2) US10609419B2 (ja)
JP (2) JP6642573B2 (ja)
CN (1) CN107683605B (ja)
WO (1) WO2016208241A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US10897612B2 (en) 2017-03-03 2021-01-19 Qualcomm Incorporated Coding identifiers for motion constrained tile sets
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
GB2569107B (en) * 2017-11-29 2022-04-06 Displaylink Uk Ltd Managing display data
TW201944778A (zh) * 2018-04-09 2019-11-16 晨星半導體股份有限公司 幀內預測模式決定裝置與幀內預測模式決定方法
US11758132B2 (en) 2018-12-28 2023-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and decoder, encoding method and decoding method with complexity handling for flexibly sized picture partitions
TW202147850A (zh) * 2020-05-01 2021-12-16 美商Op解決方案公司 用於組合無損和有損寫碼之方法和系統
EP4300957A1 (en) * 2022-06-30 2024-01-03 Nokia Technologies Oy A method, an apparatus and a computer program product for implementing gradual decoding refresh

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795588A (ja) 1993-09-20 1995-04-07 Toshiba Corp 動画像符号化装置
JP3450384B2 (ja) 1993-09-20 2003-09-22 株式会社東芝 動画像符号化装置
JP3630474B2 (ja) 1995-07-14 2005-03-16 沖電気工業株式会社 動画像伝送システム及び動画像伝送装置
JP3927422B2 (ja) 2002-02-27 2007-06-06 株式会社メガチップス 動画像送受信システム、動画像送受信方法及びそれらのプログラム
US8098261B2 (en) * 2006-09-05 2012-01-17 Apple Inc. Pillarboxing correction
US8406296B2 (en) * 2008-04-07 2013-03-26 Qualcomm Incorporated Video refresh adaptation algorithms responsive to error feedback
EP2608547B1 (en) * 2010-08-17 2018-03-21 LG Electronics Inc. Apparatus and method for receiving digital broadcasting signal
EP2451151B1 (en) * 2010-11-08 2014-08-13 Deluxe Media Inc. Method and apparatus for use in controlling the playback of contents related with a recorded content.
US8761245B2 (en) * 2010-12-21 2014-06-24 Intel Corporation Content adaptive motion compensation filtering for high efficiency video coding
US9025672B2 (en) 2011-05-04 2015-05-05 Cavium, Inc. On-demand intra-refresh for end-to end coded video transmission systems
US20120287987A1 (en) * 2011-05-13 2012-11-15 Madhukar Budagavi Coding of Scene Changes Using Picture Dropping
PL2744202T3 (pl) * 2011-08-11 2020-12-28 Sun Patent Trust Sposób kodowania obrazów, sposób dekodowania obrazów, urządzenie do kodowania obrazów, urządzenie do dekodowania obrazów oraz urządzenie do kodowania/dekodowania obrazów
CN102946533B (zh) * 2011-09-02 2016-08-17 斯凯普公司 视频编码
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
US20130107973A1 (en) * 2011-10-28 2013-05-02 Qualcomm Incorporated Loop filtering control over tile boundaries
KR102030205B1 (ko) * 2012-01-20 2019-10-08 선 페이턴트 트러스트 시간 움직임 벡터 예측을 사용하여 비디오를 부호화 및 복호하는 방법 및 장치
US9838684B2 (en) * 2012-04-11 2017-12-05 Qualcomm Incorporated Wavefront parallel processing for video coding
JP6295951B2 (ja) * 2012-06-25 2018-03-20 ソニー株式会社 画像復号装置及び画像復号方法
WO2014045507A1 (ja) * 2012-09-19 2014-03-27 日本電気株式会社 動画像符号化装置
US9749627B2 (en) 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
WO2015009676A1 (en) 2013-07-15 2015-01-22 Sony Corporation Extensions of motion-constrained tile sets sei message for interactivity
JP2015106747A (ja) * 2013-11-28 2015-06-08 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6338429B2 (ja) * 2014-04-15 2018-06-06 キヤノン株式会社 被写体検出装置、被写体検出方法及びプログラム
US9800898B2 (en) * 2014-10-06 2017-10-24 Microsoft Technology Licensing, Llc Syntax structures indicating completion of coded regions
US9866789B2 (en) * 2015-02-25 2018-01-09 Echostar Technologies L.L.C. Automatic program formatting for TV displays

Also Published As

Publication number Publication date
US10609419B2 (en) 2020-03-31
CN107683605B (zh) 2021-12-03
US20200204831A1 (en) 2020-06-25
JP2020065285A (ja) 2020-04-23
US20180176603A1 (en) 2018-06-21
US11297354B2 (en) 2022-04-05
WO2016208241A1 (ja) 2016-12-29
CN107683605A (zh) 2018-02-09
JPWO2016208241A1 (ja) 2018-04-19
JP6860061B2 (ja) 2021-04-14

Similar Documents

Publication Publication Date Title
JP6860061B2 (ja) 復号装置及び復号方法
JP6635184B2 (ja) 画像処理装置および方法
US11758139B2 (en) Image processing device and method
US11095879B2 (en) Image encoding device and method, and image decoding device and method
TWI624173B (zh) 圖像處理裝置、圖像處理方法、程式及記錄媒體
US20200020134A1 (en) Image processing apparatus and method
WO2014002896A1 (ja) 符号化装置および符号化方法、復号装置および復号方法
WO2017094298A1 (ja) 画像処理装置、画像処理方法及びプログラム
JP6747430B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20190020877A1 (en) Image processing apparatus and method
JP6711353B2 (ja) 画像処理装置および画像処理方法
US20150030068A1 (en) Image processing device and method
JP2014207536A (ja) 画像処理装置および方法
WO2016147836A1 (ja) 画像処理装置および方法
US20190132590A1 (en) Image processing device and method
WO2014148070A1 (ja) 画像処理装置及び画像処理方法
WO2015059973A1 (ja) 画像処理装置及び画像処理方法
BR122015004025B1 (pt) dispositivo e método de processamento de imagem

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190301

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191216

R151 Written notification of patent or utility model registration

Ref document number: 6642573

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151