JP6319083B2 - 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 - Google Patents
画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 Download PDFInfo
- Publication number
- JP6319083B2 JP6319083B2 JP2014524678A JP2014524678A JP6319083B2 JP 6319083 B2 JP6319083 B2 JP 6319083B2 JP 2014524678 A JP2014524678 A JP 2014524678A JP 2014524678 A JP2014524678 A JP 2014524678A JP 6319083 B2 JP6319083 B2 JP 6319083B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- cra
- sample
- information
- box
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 230000000007 visual effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 66
- 230000008569 process Effects 0.000 description 50
- 239000000872 buffer Substances 0.000 description 35
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 22
- 230000015654 memory Effects 0.000 description 22
- 238000003384 imaging method Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 20
- 239000012634 fragment Substances 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/22—Means responsive to presence or absence of recorded information signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B19/00—Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
- G11B19/02—Control of operating function, e.g. switching from recording to reproducing
- G11B19/12—Control of operating function, e.g. switching from recording to reproducing by sensing distinguishing features of or on records, e.g. diameter end mark
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3027—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3081—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is a video-frame or a video-field (P.I.P)
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
- H04N21/4325—Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8451—Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00072—Time or data compression or expansion the compressed signal including a video signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
1.一実施形態に係る画像符号化装置の構成例
2.CRA情報の例
2−1.CRA情報用の専用ボックス(Non-Fragmented Movie)
2−2.ランダムアクセス情報用の共用ボックス(Non-Fragmented Movie)
2−3.CRA情報用の専用ボックス(Fragmented Movie)
2−4.ランダムアクセス情報用の共用ボックス(Fragmented Movie)
2−5.サンプルグループの活用
3.一実施形態に係る画像復号装置の構成例
4.復号処理の流れ
4−1.Non-Fragmented Movieのための復号処理
4−2.Fragmented Movieのための復号処理
5.応用例
6.まとめ
本節では、CRAピクチャへのランダムアクセスをサポートする新たなファイルフォーマットの動画ファイルに、HEVC方式に従って符号化された画像データを記録する画像符号化装置について説明する。
符号化部11は、HEVC方式に従って動作するエンコーダである。符号化部11は、画像符号化装置10に接続されるカメラ又はテレビジョンチューナなどの動画ソースから、符号化すべき画像シーケンスを取得する。そして、符号化部11は、取得した画像シーケンス内の各画像についてイントラ予測、フレーム間予測、直交変換、量子化及び可逆符号化などの様々な処理を実行することにより、符号化ビットストリームを生成する。画像の実体に相当するスライスデータは、VCL(Video Coding Layer) NALユニットとして生成される。一方、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)及びAPS(Adaptation Parameter Set)などのパラメータセットは、非VCL NALユニットとして生成され得る。符号化部11は、VCL NALユニット、即ちスライスデータのビットストリームを、VCLバッファ13を介してファイル生成部15へ出力する。また、符号化部11は、パラメータセットを、非VCLバッファ14を介してファイル生成部15へ出力する。
判定部12は、符号化部11により符号化される画像シーケンス内の各画像のタイプを判定する。より具体的には、本実施形態において、判定部12は、各画像がIDRピクチャ、CRAピクチャ及びそれ以外のピクチャのいずれであるかを少なくとも判定する。IDRピクチャ及びCRAピクチャの双方とも、Iスライスのみからなるピクチャである。上述したように、IDRピクチャは、シーケンスの先頭のピクチャである。IDRピクチャに後続する同一シーケンス内のピクチャは、符号化順(復号順)でIDRピクチャよりも前のピクチャを参照せず、且つ表示順でIDRピクチャよりも後にのみ位置する。CRAピクチャは、シーケンスの途中に位置し、デコーダ側でのランダムアクセスの際に復号開始ピクチャとして使用可能なピクチャである。CRAピクチャに符号化順(復号順)及び表示順の双方で後続するピクチャは、符号化順(復号順)でCRAピクチャに先行するピクチャ及び表示順でCRAピクチャに先行するピクチャの双方を参照しない。判定部12は、判定の結果を、符号化部11及びファイル生成部15へ出力する。符号化部11は、判定部12により判定された各画像のタイプを示すNALユニットタイプを、各NALユニットのNALヘッダに付与する。
VCLバッファ13は、VCL NALユニットをバッファリングする。CRAピクチャのスライスデータは、VCLバッファ13によりバッファリングされる。非VCLバッファ14は、非VCL NALユニットをバッファリングする。
ファイル生成部15は、ヘッダ領域及びデータ領域を含むファイルフォーマットに従って、符号化された一連の画像データを格納する動画ファイル20を生成する。本明細書では、ファイルフォーマットとしてMP4フォーマットが利用される例を主に説明する。しかしながら、本開示に係る技術は、かかる例に限定されず、ヘッダ領域とデータ領域とを有するその他の種類の動画ファイルフォーマットに適用可能である。
制御部16は、画像符号化装置10において実行される符号化処理を制御する。例えば、制御部16は、符号化開始の指示が検出されると、指定された画像シーケンスを符号化部11に符号化させる。また、制御部16は、符号化部11により符号化された画像データを格納する動画ファイル20をファイル生成部15に生成させる。制御部16は、HRD(Hypothetical Reference Decoder;仮想参照デコーダ)と呼ばれる仮想的なデコーダのモデルを用いて、デコーダのバッファを破綻させないように、符号化ストリームの生成を制御してもよい。
図2は、本実施形態において採用され得るファイルフォーマットの一例について説明するための説明図である。図2を参照すると、動画ファイル20は、moovボックス21及びmdatボックス27を含む。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しないボックスは、図示されていない。
Non-Fragmented Movieのために導入されるCRA情報用のボックスは、例えば、CRA情報のための専用のボックスであってよい。図4〜図6は、そのような専用ボックスとしてのstcsボックスの例をそれぞれ示している。stcsボックスは、FullBoxクラスを継承するCRASampleBoxクラスとして定義される。
図4に示した第1の例において、CRASampleBoxクラスは、エントリ数(entry_count)により示される数のサンプル番号(sample_number)を含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなstcsボックスを参照することにより、デコーダは、何番目のサンプルがCRAピクチャのサンプルであるかを簡易に知ることができる。
図5に示した第2の例において、CRASampleBoxクラスは、エントリ数(entry_count)により示される数の、サンプル番号(sample_number)と破損サンプル数(broken_samples)とのセットを含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。各破損サンプル数は、対応するサンプル番号により示されるCRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数(例えば、表示順での先頭からの数)を示す。なお、正常に復号されない先行ピクチャのサンプル数が未知であることが、負の値の破損サンプル数によって示されてもよい。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなstcsボックスを参照することにより、デコーダは、何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
図6に示した第3の例において、CRASampleBoxクラスは、エントリ数(entry_count)により示される数の、サンプル番号(sample_number)と破損時間長(broken_duration)とのセットを含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。各破損時間長は、対応するサンプル番号により示されるCRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長(例えば、mdhdブロック内で定義される時間単位での値)を示す。なお、正常に復号されない先行ピクチャの時間長が未知であることが、負の値の破損時間長によって示されてもよい。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなstcsボックスを参照することにより、デコーダは、何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
前項の3つの例では、CRA情報は、IDRピクチャを識別するIDR情報が格納されるボックス(例えば、stssボックス(Sync Sample Box))とは異なるstcsボックス内に格納される。これに対し、CRA情報は、IDR情報と共用のボックス内に格納されてもよい。図7〜図9は、そのような共用ボックスとしてのstraボックスの例をそれぞれ示している。straボックスは、FullBoxクラスを継承するRandomAccessSampleBoxクラスとして定義される。
図7に示した第1の例において、RandomAccessSampleBoxクラスは、エントリ数(entry_count)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)とのセットを含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。サンプルタイプの値は、例えば、NALユニットタイプと同一の値であってよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなstraボックスを参照することにより、デコーダは、何番目のサンプルがIDRピクチャのサンプルであって、何番目のサンプルがCRAピクチャのサンプルであるかを、簡易に知ることができる。
図8に示した第2の例において、RandomAccessSampleBoxクラスは、エントリ数(entry_count)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)と破損サンプル数(broken_samples)とのセットを含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。各破損サンプル数は、対応するサンプル番号により示されるピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数を示す。なお、IDRピクチャについての破損サンプル数は、省略されてもよく、又はゼロを示してもよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなstraボックスを参照することにより、デコーダは、何番目のサンプルがIDRピクチャのサンプルであって、何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
図9に示した第3の例において、RandomAccessSampleBoxクラスは、エントリ数(entry_count)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)と破損時間長(broken_duration)とのセットを含む。各サンプル番号は、mdatボックス27内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。各破損時間長は、対応するサンプル番号により示されるピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長を示す。なお、IDRピクチャについての破損時間長は、省略されてもよく、又はゼロを示してもよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなstraボックスを参照することにより、デコーダは、何番目のサンプルがIDRピクチャのサンプルであって、何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
Fragmented Movieのために導入されるCRA情報用のボックスは、例えば、CRA情報のための専用のボックスであってよい。図10〜図12は、そのような専用ボックスとしてのtfcaボックスの例をそれぞれ示している。tfcaボックスは、FullBoxクラスを継承するTrackFragmentCRAAccessBoxクラスとして定義される。
図10に示した第1の例において、TrackFragmentCRAAccessBoxクラスは、エントリ数(number_of_entry)により示される数のサンプル番号(sample_number)を含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなtfcaボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがCRAピクチャのサンプルであるかを簡易に知ることができる。
図11に示した第2の例において、TrackFragmentCRAAccessBoxクラスは、エントリ数(number_of_entry)により示される数の、サンプル番号(sample_number)と破損サンプル数(preceding_samples)とのセットを含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。各破損サンプル数は、対応するサンプル番号により示されるCRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数(例えば、表示順での先頭からの数)を示す。なお、正常に復号されない先行ピクチャのサンプル数が未知であることが、負の値の破損サンプル数によって示されてもよい。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなtfcaボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
図12に示した第3の例において、TrackFragmentCRAAccessBoxクラスは、エントリ数(number_of_entry)により示される数の、サンプル番号(sample_number)と破損時間長(preceding_duration)とのセットを含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、CRAピクチャに相当するサンプルの番号の各々を示す。各破損時間長は、対応するサンプル番号により示されるCRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長(例えば、mdhdブロック内で定義される時間単位での値)を示す。なお、正常に復号されない先行ピクチャの時間長が未知であることが、負の値の破損時間長によって示されてもよい。エントリ数は、CRAピクチャに相当するサンプルの数に等しい。このようなtfcaボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
前項の3つの例では、CRA情報は、IDRピクチャを識別するIDR情報が格納されるボックスとは異なるtfcaボックス内に格納される。これに対し、CRA情報は、IDR情報と共用のボックス内に格納されてもよい。図13〜図15は、そのような共用ボックスとしてのtfr2ボックスの例をそれぞれ示している。tfr2ボックスは、FullBoxクラスを継承するExtTrackFragmentRandomAccessBoxクラスとして定義される。
図13に示した第1の例において、ExtTrackFragmentRandomAccessBoxクラスは、エントリ数(number_of_entry)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)とのセットを含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。サンプルタイプの値は、例えば、NALユニットタイプと同一の値であってよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなtfr2ボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがIDRピクチャのサンプルであって何番目のサンプルがCRAピクチャのサンプルであるかを、簡易に知ることができる。
図14に示した第2の例において、ExtTrackFragmentRandomAccessBoxクラスは、エントリ数(number_of_entry)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)と破損サンプル数(preceding_samples)とのセットを含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。各破損サンプル数は、対応するサンプル番号により示されるピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数を示す。なお、IDRピクチャについての破損サンプル数は、省略されてもよく、又はゼロを示してもよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなtfr2ボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがIDRピクチャのサンプルであって何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
図15に示した第3の例において、ExtTrackFragmentRandomAccessBoxクラスは、エントリ数(number_of_entry)により示される数の、サンプルタイプ(sample_type)とサンプル番号(sample_number)と破損時間長(preceding_duration)とのセットを含む。各サンプル番号は、対応するフラグメントのmdatボックス内のチャンクに含まれる一連のサンプルのうち、IDRピクチャ又はCRAピクチャに相当するサンプルの番号の各々を示す。各サンプルタイプは、対応するサンプル番号により示されるピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。各破損時間長は、対応するサンプル番号により示されるピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長を示す。なお、IDRピクチャについての破損時間長は、省略されてもよく、又はゼロを示してもよい。エントリ数は、IDRピクチャ又はCRAピクチャに相当するサンプルの数に等しい。このようなtfr2ボックスを参照することにより、デコーダは、各フラグメントの何番目のサンプルがIDRピクチャのサンプルであって何番目のサンプルがCRAピクチャのサンプルであるか、及び、各CRAピクチャへのランダムアクセスが行われる場合にどの先行ピクチャを正常に復号することができないかを、簡易に知ることができる。
CRA情報は、図4〜図15の例のように新たに定義される拡張サンプルボックス内に格納される代わりに、1つ以上のサンプルをグルーピングするための既存のサンプルグループ情報の仕組みを活用することにより定義されてもよい。
図16及び図17は、基本的なサンプルグループ情報用のボックスについて説明するための説明図である。
図18を参照すると、VisualSampleGroupEntryクラスを継承するCRAEntryクラスのシンタックスが示されている。グルーピングタイプは、“crap”である。CRAEntryクラスは、予約フィールドのみを含む。図16を用いて説明したsbgpボックスにおいてCRAEntryクラスのサンプルグループと関連付けられるサンプルは、CRAピクチャのサンプルである。
図19を参照すると、VisualSampleGroupEntryクラスを継承するCRAPointEntryクラスのシンタックスが示されている。グルーピングタイプは、“crap”である。CRAPointEntryクラスは、グループ属性として破損サンプル数(broken_samples)を含む。図16を用いて説明したsbgpボックスにおいてCRAPointEntryクラスのサンプルグループと関連付けられるサンプルは、CRAピクチャのサンプルである。破損サンプル数は、各CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数(例えば、表示順での先頭からの数)を示す。
図20を参照すると、VisualSampleGroupEntryクラスを継承するCRAPointEntryクラスの別のシンタックスが示されている。グルーピングタイプは、“crap”である。CRAPointEntryクラスは、グループ属性として破損時間長(broken_duration)を含む。破損時間長は、各CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長を示す。
図21を参照すると、VisualSampleGroupEntryクラスを継承するExtRAPEntryクラスのシンタックスが示されている。グルーピングタイプは、“rap2”である。ExtRAPEntryクラスは、グループ属性としてサンプルタイプ(sample_type)を含む。図16を用いて説明したsbgpボックスにおいてExtRAPEntryクラスのサンプルグループと関連付けられるサンプルは、IDRピクチャ又はCRAピクチャのサンプルである。サンプルタイプは、各ピクチャがIDRピクチャ及びCRAピクチャのいずれであるかを示す。サンプルタイプの値は、例えば、NALユニットタイプと同一の値であってよい。
図22を参照すると、VisualSampleGroupEntryクラスを継承するExtRAPEntryクラスの他のシンタックスが示されている。グルーピングタイプは、“rap2”である。ExtRAPEntryクラスは、グループ属性として、サンプルタイプ(sample_type)及び破損サンプル数(broken_samples)を含む。破損サンプル数は、各ピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャのサンプル数を示す。なお、IDRピクチャについての破損サンプル数は、省略されてもよく、又はゼロを示してもよい。
図23を参照すると、VisualSampleGroupEntryクラスを継承するExtRAPEntryクラスのまた別のシンタックスが示されている。グルーピングタイプは、“rap2”である。ExtRAPEntryクラスは、グループ属性として、サンプルタイプ(sample_type)及び破損時間長(broken_duration)を含む。破損時間長は、各ピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャの合計時間長を示す。なお、IDRピクチャについての破損時間長は、省略されてもよく、又はゼロを示してもよい。
本節では、前節で説明したような新たなファイルフォーマットの動画ファイルから、符号化された画像データをHEVC方式に従って復号する画像復号装置について説明する。図24は、一実施形態に係る画像復号装置30の構成の一例を示すブロック図である。図24を参照すると、画像復号装置30は、VCLバッファ31、非VCLバッファ32、パラメータメモリ33、復号部34、出力バッファ35、CRA情報取得部36及び制御部37を備える。
VCLバッファ31は、動画ファイル20のデータ領域(例えば、mdatボックス)から読み込まれる画像データ(典型的には、スライスデータ)のビットストリームをバッファリングする。非VCLバッファ32は、動画ファイル20のヘッダ領域(例えば、moovボックス)から読み込まれるSPS、PPS及びAPSなどのパラメータセット、並びにCRA情報などのヘッダ情報をバッファリングする。
パラメータメモリ33は、非VCLバッファ32を介して取得されるファイルのヘッダ領域内の情報を一括的に記憶する。上述した様々な形式で動画ファイル20のヘッダ領域に記録され得るCRA情報は、動画ファイル20が開かれている間、パラメータメモリ33により保持される。
復号部34は、HEVC方式に従って動作するデコーダである。復号部34は、VCLバッファ31を介して動画ファイル20のデータ領域から取得されるビットストリームから、画像シーケンスを復号する。復号部34は、画像を復号する際に、パラメータメモリ33により記憶されるパラメータセット内のパラメータを使用する。復号部34は、復号した画像シーケンス内の画像を表示順に並び替え、並び替え後の画像を出力バッファ35へ出力する。
出力バッファ35は、復号部34により復号された画像をバッファリングするための復号ピクチャバッファ(DPB;Decoded Picture Buffer)である。出力バッファ35によりバッファリングされた画像は、当該画像の出力タイミングにおいて、図示しないディスプレイ又はプロセッサへ出力される。
CRA情報取得部36は、動画ファイル20のヘッダ領域から非VCLバッファ32を介してパラメータメモリ33に読み込まれるCRA情報を取得する。CRA情報は、復号される画像シーケンス内の1つ以上のCRAピクチャを少なくとも識別する情報である。CRA情報は、CRA情報の専用のサンプルボックス又は共用のサンプルボックスに格納される情報であってもよい。その代わりに、CRA情報は、1つ以上のCRAピクチャをグルーピングするサンプルグループ情報であってもよい。CRA情報は、各CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャを識別するための先行ピクチャ情報を含んでもよい。CRA情報取得部36は、取得したCRA情報を制御部37へ出力する。
制御部37は、画像復号装置30において実行される復号処理を制御する。例えば、制御部37は、ユーザからの指示に応じて動画ファイル20を開き、復号部34に画像シーケンスの復号を開始させる。また、制御部37は、ランダムアクセスの指示が検出された場合に、CRA情報取得部36により取得されるCRA情報を用いて、画像シーケンス内のいずれかのCRAピクチャを復号開始ピクチャとして特定する。そして、制御部37は、特定した復号開始ピクチャから(即ち、動画トラックの途中から)復号部34に画像シーケンスを復号させる。
[4−1.Non-Fragmented Movieのための復号処理]
(1)全体的な流れ
図25は、図24に例示した画像復号装置30により実行される復号処理の流れの第1の例を示すフローチャートである。第1の例は、Non-Fragmented Movie構造を有する画像シーケンスの復号に関連する。
図26は、図25のステップS120に相当する、指定時刻Tに対応するサンプル番号Xを取得するための処理の流れの一例を示すフローチャートである。
図27は、図25のステップS130に相当する、復号開始ピクチャを特定するための処理の流れの第1の例を示すフローチャートである。第1の例において、CRA情報は、図4〜図6に例示したstcsボックス又は図7〜図9に例示したstraボックスに格納されているものとする。
図29〜図31は、図25のステップS160からステップS190への移行に際して、正常に復号されない先行ピクチャの出力をスキップするための処理の流れの3つの例をそれぞれ示している。
(1)全体的な流れ
図32は、図24に例示した画像復号装置30により実行される復号処理の流れの第2の例を示すフローチャートである。第2の例は、Fragmented Movie構造を有する画像シーケンスの復号に関連する。
図33は、図32のステップS230に相当する、復号開始ピクチャを特定するための処理の流れの一例を示すフローチャートである。図33の例において、CRA情報は、図10〜図12に例示したtfcaボックス又は図13〜図15に例示したtfr2ボックスに格納されているものとする。
上述した実施形態に係る画像符号化装置10及び画像復号装置30は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
図34は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース909、制御部910、ユーザインタフェース911、及びバス912を備える。
図35は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
図36は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データ及び映像データを復号する。
図37は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。
ここまで、図1〜図37を用いて、本開示に係る技術の様々な実施形態について詳細に説明した。上述した実施形態によれば、ランダムアクセスの際に復号開始ピクチャとして使用可能なCRAピクチャを識別するCRA情報がファイルフォーマットのヘッダ領域に挿入される。従って、デコーダは、データ領域内の画像データに付与されるNALユニットタイプを一連の画像データにわたって調べることなく、CRAピクチャへのランダムアクセスを簡易に実現することができる。
(1)
ヘッダ領域及びデータ領域を含むファイルフォーマットの前記ヘッダ領域から、前記データ領域に挿入されている画像シーケンス内の1つ以上のCRA(Clean Random Access)ピクチャを識別するCRA情報を取得する取得部と、
ランダムアクセスの指示が検出された場合に、前記CRA情報を用いて、前記画像シーケンス内のいずれかのCRAピクチャを復号開始ピクチャとして特定する制御部と、
前記制御部により特定された前記復号開始ピクチャから、前記画像シーケンスを復号する復号部と、
を備える画像復号装置。
(2)
前記ファイルフォーマットは、MP4フォーマットであり、
前記CRA情報は、前記1つ以上のCRAピクチャをグルーピングするサンプルグループ情報である、
前記(1)に記載の画像復号装置。
(3)
前記ファイルフォーマットは、MP4フォーマットであり、
前記取得部は、前記CRA情報を格納するために拡張された拡張サンプルボックスから、前記CRA情報を取得する、
前記(1)に記載の画像復号装置。
(4)
前記拡張サンプルボックスは、IDR(Instantaneous Decoding Refresh)ピクチャを識別するIDR情報をさらに含むボックスである、前記(3)に記載の画像復号装置。
(5)
前記拡張サンプルボックスは、IDRピクチャを識別するIDR情報を含むボックスとは別に定義されるボックスである、前記(3)に記載の画像復号装置。
(6)
前記CRA情報は、各CRAピクチャに表示順で先行し且つ当該CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャを識別するための先行ピクチャ情報を含み、
前記制御部は、前記先行ピクチャ情報に基づいて、前記先行ピクチャの前記画像復号装置からの出力をスキップさせる、
前記(2)〜(5)のいずれか1項に記載の画像復号装置。
(7)
前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャの数を示す、前記(6)に記載の画像復号装置。
(8)
前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャに対応する時間長を示す、前記(6)に記載の画像復号装置。
(9)
前記制御部は、ランダムアクセスの前記指示において指定されるタイミングの最も近傍に位置するCRAピクチャを、前記CRA情報を用いて前記復号開始ピクチャとして特定する、前記(1)〜(8)のいずれか1項に記載の画像復号装置。
(10)
ヘッダ領域及びデータ領域を含むファイルフォーマットの前記ヘッダ領域から、前記データ領域に挿入されている画像シーケンス内の1つ以上のCRA(Clean Random Access)ピクチャを識別するCRA情報を取得することと、
ランダムアクセスの指示が検出された場合に、前記CRA情報を用いて、前記画像シーケンス内のいずれかのCRAピクチャを復号開始ピクチャとして特定することと、
特定された前記復号開始ピクチャから、前記画像シーケンスを復号することと、
を含む画像復号方法。
(11)
画像シーケンス内の画像を符号化して、画像データを生成する符号化部と、
ランダムアクセスの際に復号開始ピクチャとして使用可能な前記画像シーケンス内の1つ以上のCRA(Clean Random Access)ピクチャを判定する判定部と、
ヘッダ領域及びデータ領域を含むファイルフォーマットの前記ヘッダ領域に前記判定部により判定された前記1つ以上のCRAピクチャを識別するCRA情報を挿入し、前記データ領域に前記画像データを挿入するファイル生成部と、
を備える画像符号化装置。
(12)
前記ファイルフォーマットは、MP4フォーマットであり、
前記CRA情報は、前記1つ以上のCRAピクチャをグルーピングするサンプルグループ情報である、
前記(11)に記載の画像符号化装置。
(13)
前記ファイルフォーマットは、MP4フォーマットであり、
前記ファイル生成部は、前記CRA情報を格納するために拡張された拡張サンプルボックスに前記CRA情報を格納する、
前記(11)に記載の画像符号化装置。
(14)
前記ファイル生成部は、IDR(Instantaneous Decoding Refresh)ピクチャを識別するIDR情報を前記拡張サンプルボックスにさらに格納する、前記(13)に記載の画像符号化装置。
(15)
前記拡張サンプルボックスは、IDRピクチャを識別するIDR情報が格納されるボックスとは別に定義されるボックスである、前記(13)に記載の画像符号化装置。
(16)
前記判定部は、各CRAピクチャに表示順で先行し且つ当該CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャをさらに判定し、
前記ファイル生成部は、前記判定部により判定されたCRAピクチャごとの前記先行ピクチャを識別する先行ピクチャ情報を前記CRA情報に含める、
前記(12)〜(15)のいずれか1項に記載の画像符号化装置。
(17)
前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャの数を示す、前記(16)に記載の画像復号装置。
(18)
前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャに対応する時間長を示す、前記(16)に記載の画像復号装置。
(19)
画像シーケンス内の画像を符号化して、画像データを生成することと、
ランダムアクセスの際に復号開始ピクチャとして使用可能な前記画像シーケンス内の1つ以上のCRA(Clean Random Access)ピクチャを判定することと、
ヘッダ領域及びデータ領域を含むファイルフォーマットの前記ヘッダ領域に、判定された前記1つ以上のCRAピクチャを識別するCRA情報を挿入することと、
前記データ領域に前記画像データを挿入することと、
を含む画像符号化方法。
11 符号化部
12 判定部
15 ファイル生成部
16 制御部
20 動画ファイル
21 ヘッダ領域
27 データ領域
30 画像復号装置
34 復号部
36 CRA情報取得部
37 制御部
Claims (17)
- ヘッダ領域と、符号化された一連の画像の実データを含む符号化ストリームが格納されるデータ領域とを含むファイルフォーマットに従って生成されたファイルの前記ヘッダ領域から取得される、前記一連の画像内の1つ以上のCRA(Clean Random Access)ピクチャを識別するCRA情報に基づいて画像を復号する復号部、
を備える画像復号装置。 - 前記CRA情報は、ランダムアクセスの指示が検出された場合に復号開始ピクチャを特定するために使用される、請求項1に記載の画像復号装置。
- 前記CRA情報は、NALユニットタイプを含む、請求項1に記載の画像復号装置。
- 前記ヘッダ領域は、MP4フォーマットのmoovボックスである、請求項1に記載の画像復号装置。
- 前記CRA情報は、前記1つ以上のCRAピクチャをグルーピングするサンプルグループ情報である、請求項1に記載の画像復号装置。
- 前記ヘッダ領域から、前記一連の画像データ内の前記1つ以上のCRAピクチャを識別する前記CRA情報を取得する取得部と、
前記CRA情報を用いて、前記一連の画像データ内のいずれかのCRAピクチャを復号開始ピクチャとして特定する制御部と、
をさらに備える、請求項1に記載の画像復号装置。 - 前記取得部は、前記CRA情報を格納するために拡張された拡張サンプルボックスから、前記CRA情報を取得する、請求項6に記載の画像復号装置。
- 前記CRA情報は、前記moovボックス内のsgpdボックス(Sample Group Description Box)に格納される、請求項4に記載の画像復号装置。
- 前記CRA情報は、前記sgpdボックス内のVisualSampleGroupEntryクラスに基づくエントリにより定義される、請求項8に記載の画像復号装置。
- 前記拡張サンプルボックスは、IDR(Instantaneous Decoding Refresh)ピクチャを識別するIDR情報をさらに含むボックスである、請求項7に記載の画像復号装置。
- 前記拡張サンプルボックスは、IDRピクチャを識別するIDR情報を含むボックスとは別に定義されるボックスである、請求項7に記載の画像復号装置。
- 前記CRA情報は、各CRAピクチャに表示順で先行し且つ当該CRAピクチャへのランダムアクセスが行われた場合に正常に復号されない先行ピクチャを識別するための先行ピクチャ情報を含み、
前記先行ピクチャ情報に基づいて、前記先行ピクチャの前記画像復号装置からの出力がスキップされる、
請求項5に記載の画像復号装置。 - 前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャの数を示す、請求項12に記載の画像復号装置。
- 前記先行ピクチャ情報は、各CRAピクチャについての前記先行ピクチャに対応する時間長を示す、請求項12に記載の画像復号装置。
- 前記制御部は、ランダムアクセスの指示において指定されるタイミングの最も近傍に位置するCRAピクチャを、前記CRA情報を用いて前記復号開始ピクチャとして特定する、請求項6いずれか1項に記載の画像復号装置。
- ヘッダ領域と、符号化された一連の画像の実データを含む符号化ストリームが格納されるデータ領域とを含むファイルフォーマットに従って生成されたファイルの前記ヘッダ領域から取得される、前記一連の画像内の1つ以上のCRA(Clean Random Access)ピクチャを識別するCRA情報に基づいて画像を復号すること、
を含む画像復号方法。 - ヘッダ領域と、符号化された一連の画像の実データを含む符号化ストリームが格納されるデータ領域とを含むファイルフォーマットに従って生成されたファイルの前記ヘッダ領域から取得される、前記一連の画像内の1つ以上のCRA(Clean Random Access)ピクチャを識別するCRA情報に基づいて画像を復号すること、
を画像復号装置のコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012154557 | 2012-07-10 | ||
JP2012154557 | 2012-07-10 | ||
PCT/JP2013/063178 WO2014010300A1 (ja) | 2012-07-10 | 2013-05-10 | 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014010300A1 JPWO2014010300A1 (ja) | 2016-06-20 |
JP6319083B2 true JP6319083B2 (ja) | 2018-05-09 |
Family
ID=49915775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014524678A Active JP6319083B2 (ja) | 2012-07-10 | 2013-05-10 | 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10062416B2 (ja) |
JP (1) | JP6319083B2 (ja) |
CN (2) | CN107820089B (ja) |
WO (1) | WO2014010300A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10116576B2 (en) * | 2015-10-19 | 2018-10-30 | Samsung Electronics Co., Ltd. | Methods and apparatus for random access of HEVC bitstream for MMT |
CN108476346B (zh) * | 2016-01-13 | 2021-03-12 | 索尼公司 | 信息处理装置和信息处理方法 |
CN105741861B (zh) * | 2016-02-05 | 2017-12-15 | 京东方科技集团股份有限公司 | 智能播放系统、方法、可穿戴设备、主体单元和播放单元 |
JP7077141B2 (ja) * | 2018-05-28 | 2022-05-30 | シャープ株式会社 | 画像記録装置、画像記録方法およびプログラム |
CN115150348B (zh) * | 2021-03-30 | 2024-05-03 | 奇安信科技集团股份有限公司 | 邮件附件还原方法及系统 |
CN115080531B (zh) * | 2022-05-16 | 2024-07-23 | 重庆紫光华山智安科技有限公司 | 基于分布式存储图像处理方法、系统、设备及介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3080087B2 (ja) * | 1998-12-28 | 2000-08-21 | 日本電気株式会社 | 画像処理方法及びその装置 |
US8214655B2 (en) * | 2002-03-29 | 2012-07-03 | Kabushiki Kaisha Toshiba | Data structure of multimedia file format, encrypting method and device thereof, and decrypting method and device thereof |
CN101010952A (zh) * | 2004-09-01 | 2007-08-01 | 松下电器产业株式会社 | 图像再生方法以及图像再生装置 |
CN101198052B (zh) * | 2006-12-04 | 2010-05-19 | 华为技术有限公司 | 一种视频编码方法、解码方法及其装置 |
CN101459840B (zh) * | 2007-12-13 | 2010-04-21 | 华为技术有限公司 | 视频图像编码和解码方法及装置和系统 |
US8509434B2 (en) * | 2008-06-20 | 2013-08-13 | Korean Broadcasting System | Method and apparatus for protecting scalable video coding contents |
TW201210325A (en) * | 2010-07-21 | 2012-03-01 | Nokia Corp | Method and apparatus for indicating switching points in a streaming session |
US9706227B2 (en) * | 2011-03-10 | 2017-07-11 | Qualcomm Incorporated | Video coding techniques for coding dependent pictures after random access |
US9026671B2 (en) * | 2011-04-05 | 2015-05-05 | Qualcomm Incorporated | IP broadcast streaming services distribution using file delivery methods |
KR20140057533A (ko) * | 2011-07-15 | 2014-05-13 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 랜덤 액세스 픽처를 청정하게 하기 위해 가장 낮은 계층 식별을 할당하기 위한 인코더 및 방법 |
US20130089152A1 (en) * | 2011-10-05 | 2013-04-11 | Qualcomm Incorporated | Signaling picture identification for video coding |
US9351016B2 (en) * | 2012-04-13 | 2016-05-24 | Sharp Kabushiki Kaisha | Devices for identifying a leading picture |
US9532055B2 (en) * | 2012-04-16 | 2016-12-27 | Microsoft Technology Licensing, Llc | Constraints and unit types to simplify video random access |
US9979959B2 (en) * | 2012-04-20 | 2018-05-22 | Qualcomm Incorporated | Video coding with enhanced support for stream adaptation and splicing |
JP6045222B2 (ja) * | 2012-06-28 | 2016-12-14 | 株式会社Nttドコモ | 動画像予測復号装置、方法及びプログラム |
-
2013
- 2013-05-10 WO PCT/JP2013/063178 patent/WO2014010300A1/ja active Application Filing
- 2013-05-10 JP JP2014524678A patent/JP6319083B2/ja active Active
- 2013-05-10 CN CN201711105400.9A patent/CN107820089B/zh not_active Expired - Fee Related
- 2013-05-10 CN CN201380035503.6A patent/CN104412608B/zh not_active Expired - Fee Related
- 2013-05-10 US US14/412,480 patent/US10062416B2/en active Active
-
2018
- 2018-05-29 US US15/991,484 patent/US10283167B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10062416B2 (en) | 2018-08-28 |
CN107820089B (zh) | 2020-05-19 |
CN104412608B (zh) | 2018-03-06 |
US20180277163A1 (en) | 2018-09-27 |
CN107820089A (zh) | 2018-03-20 |
JPWO2014010300A1 (ja) | 2016-06-20 |
WO2014010300A1 (ja) | 2014-01-16 |
CN104412608A (zh) | 2015-03-11 |
US20150194188A1 (en) | 2015-07-09 |
US10283167B2 (en) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10283167B2 (en) | Image decoding device, image decoding method, image encoding device, and image encoding method | |
US8249167B2 (en) | PVR-support video decoding system | |
JP4974984B2 (ja) | 映像記録装置及び方法 | |
AU2019219782B2 (en) | Image-processing device and method | |
JP2013093755A (ja) | 映像記録装置及び映像記録方法 | |
EP1605466A1 (en) | Transcoding closed captioning data from broadcast DTV onto DVD | |
US8655142B2 (en) | Apparatus and method for display recording | |
US8744235B2 (en) | Method and apparatus for processing additional data in broadcast signal, method and apparatus for recording broadcast signal, and method and apparatus for reproducing recorded broadcasting signal | |
CN110036646B (zh) | 解码器、编码器、计算机程序及方法 | |
EP1926104B1 (en) | Encoding device, decoding device, recording device, audio/video data transmission system | |
JP2015126469A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP2006319397A (ja) | デジタル記録再生装置 | |
US20120027075A1 (en) | Signal Processing Apparatus and Signal Processing Method | |
US20150255119A1 (en) | Display apparatus and method for editing and displaying recorded video content | |
JP6479905B2 (ja) | 放送信号送信装置および放送信号送受信装置 | |
JP5349638B2 (ja) | 信号処理装置及び信号処理方法 | |
WO2014002618A1 (ja) | 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 | |
KR20130008244A (ko) | 영상처리장치 및 그 제어방법 | |
JP2006067142A (ja) | 復号装置 | |
KR20080057685A (ko) | 방송 녹화 시스템의 녹화된 데이터 검색 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160426 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180319 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6319083 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |