JP7104352B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents
画像処理装置、画像処理方法及び画像処理プログラム Download PDFInfo
- Publication number
- JP7104352B2 JP7104352B2 JP2020548382A JP2020548382A JP7104352B2 JP 7104352 B2 JP7104352 B2 JP 7104352B2 JP 2020548382 A JP2020548382 A JP 2020548382A JP 2020548382 A JP2020548382 A JP 2020548382A JP 7104352 B2 JP7104352 B2 JP 7104352B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- decoding
- frame group
- unit
- decompression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 48
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000012937 correction Methods 0.000 claims description 86
- 230000006837 decompression Effects 0.000 claims description 65
- 238000000034 method Methods 0.000 claims description 42
- 230000008569 process Effects 0.000 claims description 33
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 239000000543 intermediate Substances 0.000 description 89
- 238000007906 compression Methods 0.000 description 27
- 230000006835 compression Effects 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 18
- 230000008878 coupling Effects 0.000 description 14
- 238000010168 coupling process Methods 0.000 description 14
- 238000005859 coupling reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000013139 quantization Methods 0.000 description 13
- 239000000470 constituent Substances 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
- H04N19/426—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
- H04N19/428—Recompression, e.g. by spatial or temporal decimation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本願は、2018年9月19日に、日本に出願された特願2018-174982号に基づき優先権を主張し、その内容をここに援用する。
また、上記の従来技術は、並列性に欠けるという課題がある。従来技術は、再帰的に演算処理を行うことから、並列処理が行うことが難しい。そのため、従来技術は、分散処理システム等を用いて効率的に演算処理を行うことが難しい。
以下、本発明の第1の実施形態について、図面を参照しながら説明する。
以下、映像符号化・復号システム1の構成について説明する。
図1は、第1の実施形態に係る映像符号化・復号システム1(画像処理装置)の全体構成図である。図1に示すように、映像符号化・復号システム1は、符号化の対象となる入力映像データを取得し、当該入力映像データに対応する復号映像データを出力する。映像符号化・復号システム1は、映像符号化装置10と、映像復号装置20と、を含んで構成される。
次元圧縮部121は、映像分割部110から出力された入力フレーム群を取得する。次元圧縮部121は、取得された入力フレーム群に対し、次元数を少なくするように圧縮することにより圧縮フレーム群を生成する。次元圧縮部121は、生成された圧縮フレーム群を、量子化/エントロピー符号化部122へ出力する。
映像復号装置20は、復号部210と、映像結合部220と、を含んで構成される。
復号部210の構成を図3に示す。図3に示すように、復号部210は、エントロピー復号部211と、次元伸張部212と、中間データメモリ213と、補正部214と、を含んで構成される。
映像結合部220は、復号部210から出力された復号フレーム群を取得する。映像結合部220は、取得された復号フレーム群を結合することにより復号映像データを生成する。映像結合部220は、生成された復号映像データを最終的な出力データとして出力する。
以下、映像符号化装置10の動作の一例について説明する。
図5は、第1の実施形態に係る映像符号化装置10の動作を示すフローチャートである。
図6は、第1の実施形態に係る映像符号化・復号システム1の次元圧縮部121の構成図である。図6に示すように、次元圧縮部121は、M層からなる構成部(第1層構成部121a-1~第M層構成部121a-M)によって構成される。各構成部は、畳み込み層部c1と、ダウンサンプリング部c2と、非線形変換部c3と、によって構成される。
第1層構成部121a-1のダウンサンプリング部c2は、畳み込み層部c1から出力されたフレーム群を取得する。ダウンサンプリング部c2は、取得されたフレーム群を、次元数を少なくするように圧縮する。ダウンサンプリング部c2は、圧縮されたフレーム群を非線形変換部c3へ出力する。
第1層構成部121a-1の非線形変換部c3は、ダウンサンプリング部c2から出力されたフレーム群を取得する。非線形変換部c3は、取得されたフレーム群に対し非線形変換処理を行う。非線形変換部c3は、非線形変換処理が行われたフレーム群を、次の層の構成部(第2層構成部)の畳み込み層部c1へ出力する。
符号化部120の量子化/エントロピー符号化部122は、各圧縮フレーム群に対して量子化及びエントロピー符号化を行う。そして、量子化/エントロピー符号化部122は、量子化及びエントロピー符号化された圧縮フレーム群を連結することにより、符号化データを生成する(ステップS103)。
以上で、図5のフローチャートが示す映像符号化装置10の動作が終了する。
以下、映像復号装置20の動作の一例について説明する。
図7は、第1の実施形態に係る映像復号装置20の動作を示すフローチャートである。
復号部210の次元伸張部212は、生成されたエントロピー復号データに対して、(次元圧縮部121によって次元数が削減される前の)元の次元数に復元することにより伸張復号データを生成する(ステップS112)。
図8は、第1の実施形態に係る映像符号化・復号システム1の次元伸張部212の構成図である。図8に示すように、次元伸張部212は、M層からなる構成部(第1層構成部212a-1~第M層構成部212a-M)によって構成される。各構成部は、逆畳み込み層部c4と、非線形変換部c5と、によって構成される。
第1層構成部212a-1の非線形変換部c5は、逆畳み込み層部c4から出力されたフレーム群を取得する。非線形変換部c5は、取得されたフレーム群に対し非線形変換処理を行う。非線形変換部c5は、非線形変換処理が行われたフレーム群を、次の層の構成部(第2層構成部)の逆畳み込み層部c4へ出力する。
復号部210の中間データメモリ213は、ステップS112によって生成された伸張復号データである中間データMiを記憶する(ステップS113)。
復号部210の補正部214は、中間データメモリ213に記憶された中間データMiを用いて、次元伸張部212から取得した伸張復号データを補正する。
以上で、図7のフローチャートが示す映像復号装置20の動作が終了する。
図9は、第1の実施形態に係る映像符号化・復号システム1の補正部214の構成図である。図9に示すように、補正部214は、M層からなる構成部(第1層構成部214a-1~第M層構成部214a-M)と、スケーリング部214bと、によって構成される。各構成部は、畳み込み層部c6と、非線形変換部c7と、によって構成される。
第1層構成部214a-1の非線形変換部c7は、畳み込み層部c6から出力されたフレーム群を取得する。非線形変換部c5は、取得されたフレーム群に対し非線形変換処理を行う。非線形変換部c7は、非線形変換処理が行われたフレーム群を出力する。次の層の構成部(第2層構成部)の畳み込み層部c6へは、非線形変換部c7から出力されたフレーム群と時間的に1つ前の中間データとが加算されたデータが入力される。
以下、次元圧縮部121、次元伸張部212、及び補正部214のニューラルネットワークによる学習処理について説明する。
次元圧縮部121、次元伸張部212、及び補正部214のニューラルネットワークによる学習処理は、同時に行われる。
図10に示すように、まず入力データとして、3つの時間的に連続する入力フレーム群を1つのサンプルデータとするデータセットが入力される。以下、これら3つの入力フレーム群を、時間順にそれぞれS1(x,y,z),S2(x,y,z)(第1のフレーム群),S3(x,y,z)(第2のフレーム群)とする。
復元誤差1+復元誤差2+GAN(concat(R2,R3))
+FM(concat(S2,S3),concat(R2,R3))
・・・(1)
ΣxΣyΣz(diff(S2(x,y,z),R2(x,y,z)))
+ΣxΣyΣz(diff(S3(x,y,z),R3(x,y,z)))
・・・(2)
ΣxΣyΣz(w(z)*diff(M2(x,y,z),R2(x,y,z)))
+ΣxΣyΣz(w(z)*diff(M3(x,y,z),R3(x,y,z)))
・・・(3)
1.3つの連続する入力フレーム群を1サンプルとして用意する。
2.各サンプルを、オートエンコーダとしてのニューラルネットワーク(エンコーダ/デコーダ)に入力し、中間データを得る。
3.補正のためのニューラルネットワークよって、上記S2(x,y,z)とS3(x,y,z)に対応する復号映像データを得る。
4.下記1)~4)の値を加算することにより損失計算を行う。
1)S2(x,y,z)とR2(x,y,z)との復元誤差、及び、S3(x,y,z)とR3(x,y,z)との復元誤差。
2)M2(x,y,z)とR2(x,y,z)との重み付き復元誤差、及び、M3(x,y,z)とR3(x,y,z)との重み付き復元誤差。
3)GAN誤差(識別処理を行うニューラルネットワークに対し、R2(x,y,z)及びR3(x,y,z)を入力した時のバイナリクロスエントロピー誤差)。
4)FM誤差(識別処理を行うニューラルネットワークに対し、S2(x,y,z)及びS3(x,y,z)と、R2(x,y,z)及びR3(x,y,z)と、を入力した時の中間層特徴量の誤差)。
5.誤差逆伝播法により各ニューラルネットワークを更新する。
なお、ここでいう識別処理とは、入力された映像データに基づく映像が真の映像であるか否かを識別する処理である。
なお、2)の重み付き復元誤差は、時間的に後に隣接するフレーム群と連続させるように算出される項である。3)のGAN誤差と4)のFM誤差は、映像復号データに基づく映像がより自然な出力となるように算出される項である。
例えば、4つの時間的に連続する入力フレーム群であるS1(x,y,z),S2(x,y,z),S3(x,y,z)S4(x,y,z)から、M1(x,y,z)、M2(x,y,z),M3(x,y,z),M4(x,y,z)とR2(x,y,z),R3(x,y,z),R4(x,y,z)とが生成され、R2(x,y,z)+R3(x,y,z)+R4(x,y,z)が自然になるように(すなわち、連続性を持つように)学習が行われる構成であってもよい。
以下、本発明の第2の実施形態について、図面を参照しながら説明する。
以下、第2の実施形態に係る映像復号装置の動作の一例について説明する。
図12は、第1の実施形態に係る映像復号装置20の動作を示すフローチャートである。
復号部210aの次元伸張部212は、生成されたエントロピー復号データに対して、(次元圧縮部によって次元数が削減される前の)元の次元数に復元することにより伸張復号データを生成する(ステップS212)。
映像結合部は、生成された復号フレーム群を結合することにより復号映像データを生成する(ステップS216)。
以上で、図12のフローチャートが示す映像復号装置20の動作が終了する。
第1の実施形態では、補正対象のフレーム群(Mi)が、時間的に前のフレーム群(Mi-1)と時間的に連続するように補正されることによって主観画質が向上する構成であった。しかしながら、時間的に前のフレーム群(Mi-1)は、更に時間的に前のフレーム群(Mi-2)に基づいて補正される。そのため、時間的に前のフレーム群(Mi-1)は、補正対象のフレーム群(Mi)が参照された時点とは異なるフレーム群になっているため、最終的な出力が時間的に連続性を有していることは担保されない。
映像結合部は、生成された復号フレーム群を結合することにより復号映像データを生成する(ステップS216)。
以上で、図12のフローチャートが示す映像復号装置20の動作が終了する。
以下、第2の実施形態に係る、次元圧縮部、次元伸張部、及び補正部214のニューラルネットワークによる学習処理について説明する。
次元圧縮部、次元伸張部、及び補正部214のニューラルネットワークによる学習処理は、同時に行われる。
図13に示すように、まず入力データとして、3つの時間的に連続する入力フレーム群を1つのサンプルデータとするデータセットが入力される。以下、これら3つの入力フレーム群を、時間順にそれぞれS1(x,y,z),S2(x,y,z),S3(x,y,z)とする。
復元誤差1+GAN(concat(M1,R2,M3))
+FM(concat(S1,S2,S3),concat(M1,R2,M3))
・・・(4)
ΣxΣyΣz(diff(S1(x,y,z),M1(x,y,z)))
+ΣxΣyΣz(diff(S3(x,y,z),M3(x,y,z)))
・・・(5)
10 映像符号化装置
20 映像復号装置
110 映像分割部
120 符号化部
121 次元圧縮部
122 エントロピー符号化部
210 復号部
211 エントロピー復号部
212 次元伸張部
213 中間データメモリ
214 補正部
220 映像結合部
Claims (4)
- 映像データが分割された所定のフレーム数からなるフレーム群ごとに補正を行う画像処理装置であって、
前記フレーム群の次元を圧縮させる符号化によって得られた符号化データに対して符号化前の前記次元に伸張させる復号がなされた伸張復号データであって、 第1のフレーム群の前記伸張復号データを、前記第1のフレーム群と時間的に連続したフレーム群である第2のフレーム群の前記伸張復号データに対して時間方向に結合させる補正を行うことにより、補正後フレーム群を得る復号部
を備え、
前記復号部は、入力画像が真の画像であるか否かを識別する識別処理を行うニューラルネットワークに対して、前記補正後フレーム群と、前記第2のフレーム群の前記伸張復号データを前記第2のフレーム群より時間的に後のフレーム群の前記伸張復号データに結合させて得られる補正後フレーム群と、を入力することによって得られるバイナリクロスエントロピー誤差を最小化させるように前記補正を行う
画像処理装置。 - データが分割された所定の部分データ数からなる部分データ群ごとに補正を行う画像処理装置であって、
前記部分データ群の次元を圧縮させる符号化によって得られた符号化データに対して符号化前の前記次元に伸張させる復号がなされた伸張復号データであって、 第1の部分データ群の前記伸張復号データを、前記第1の部分データ群と時間的に連続した部分データ群である第2の部分データ群の前記伸張復号データに対して時間方向に結合させる補正を行うことにより補正後部分データ群を得る復号部
を備え、
前記復号部は、入力データが真のデータであるか否かを識別する識別処理を行うニューラルネットワークに対して、前記補正後部分データ群と、前記第2の部分データ群の前記伸張復号データを前記第2の部分データ群より時間的に後の部分データ群の前記伸張復号データに結合させて得られる補正後部分データ群と、を入力することによって得られるバイナリクロスエントロピー誤差を最小化させるように前記補正を行う
画像処理装置。 - 映像データが分割された所定のフレーム数からなるフレーム群ごとに補正を行う画像処理方法であって、
前記フレーム群の次元を圧縮させる符号化によって得られた符号化データに対して符号化前の前記次元に伸張させる復号がなされた伸張復号データであって、 第1のフレーム群の前記伸張復号データを、前記第1のフレーム群と時間的に連続したフレーム群である第2のフレーム群の前記伸張復号データに対して時間方向に結合させる補正を行うことにより、補正後フレーム群を得るステップと、
入力画像が真の画像であるか否かを識別する識別処理を行うニューラルネットワークに対して、前記補正後フレーム群と、前記第2のフレーム群の前記伸張復号データを前記第2のフレーム群より時間的に後のフレーム群の前記伸張復号データに結合させて得られる補正後フレーム群と、を入力することによって得られるバイナリクロスエントロピー誤差を最小化させるように前記補正を行うステップと、
を有する画像処理方法。 - 請求項1又は2に記載の画像処理装置としてコンピュータを機能させるための画像処理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018174982 | 2018-09-19 | ||
JP2018174982 | 2018-09-19 | ||
PCT/JP2019/035631 WO2020059581A1 (ja) | 2018-09-19 | 2019-09-11 | 画像処理装置、画像処理方法及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020059581A1 JPWO2020059581A1 (ja) | 2021-05-20 |
JP7104352B2 true JP7104352B2 (ja) | 2022-07-21 |
Family
ID=69887000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020548382A Active JP7104352B2 (ja) | 2018-09-19 | 2019-09-11 | 画像処理装置、画像処理方法及び画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11516515B2 (ja) |
JP (1) | JP7104352B2 (ja) |
WO (1) | WO2020059581A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008177648A (ja) | 2007-01-16 | 2008-07-31 | Nippon Hoso Kyokai <Nhk> | 動画像データ復号装置、及びプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999030505A1 (en) * | 1997-12-08 | 1999-06-17 | Sony Corporation | Encoder and encoding method |
US7136508B2 (en) * | 2000-11-09 | 2006-11-14 | Minolta Co., Ltd. | Image processing apparatus, method, and program for processing a moving image |
US7680326B2 (en) * | 2004-03-18 | 2010-03-16 | Fujifilm Corporation | Method, system, and program for correcting the image quality of a moving image |
JP4440051B2 (ja) * | 2004-09-08 | 2010-03-24 | キヤノン株式会社 | 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
JP4867235B2 (ja) * | 2004-10-26 | 2012-02-01 | ソニー株式会社 | 情報処理装置および情報処理方法、記録媒体、並びに、プログラム |
JP4618098B2 (ja) * | 2005-11-02 | 2011-01-26 | ソニー株式会社 | 画像処理システム |
US20080002771A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Video segment motion categorization |
JP4747975B2 (ja) * | 2006-07-14 | 2011-08-17 | ソニー株式会社 | 画像処理装置および方法、プログラム、並びに、記録媒体 |
JP5643574B2 (ja) * | 2010-08-26 | 2014-12-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
WO2015009750A1 (en) * | 2013-07-15 | 2015-01-22 | Fox Broadcasting Company | Providing bitmap image format files from media |
US10679145B2 (en) * | 2015-08-07 | 2020-06-09 | Nec Corporation | System and method for balancing computation with communication in parallel learning |
US11586960B2 (en) * | 2017-05-09 | 2023-02-21 | Visa International Service Association | Autonomous learning platform for novel feature discovery |
CN112204580B (zh) * | 2018-03-27 | 2024-04-12 | 诺基亚通信公司 | 使用深度q网络促进资源配对的方法和装置 |
US11019355B2 (en) * | 2018-04-03 | 2021-05-25 | Electronics And Telecommunications Research Institute | Inter-prediction method and apparatus using reference frame generated based on deep learning |
US10798394B2 (en) * | 2018-06-27 | 2020-10-06 | Avago Technologies International Sales Pte. Limited | Low complexity affine merge mode for versatile video coding |
US11526953B2 (en) * | 2019-06-25 | 2022-12-13 | Iqvia Inc. | Machine learning techniques for automatic evaluation of clinical trial data |
CN110464326B (zh) * | 2019-08-19 | 2022-05-10 | 上海联影医疗科技股份有限公司 | 一种扫描参数推荐方法、系统、装置及存储介质 |
-
2019
- 2019-09-11 JP JP2020548382A patent/JP7104352B2/ja active Active
- 2019-09-11 US US17/273,366 patent/US11516515B2/en active Active
- 2019-09-11 WO PCT/JP2019/035631 patent/WO2020059581A1/ja active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008177648A (ja) | 2007-01-16 | 2008-07-31 | Nippon Hoso Kyokai <Nhk> | 動画像データ復号装置、及びプログラム |
Non-Patent Citations (3)
Title |
---|
AKBARI, Mohammad and LIANG, Jie,Semi-Recurrent Cnn-Based Vae-Gan for Sequential Data Generation,2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP),IEEE,2018年09月13日,pp. 2321-2325 |
MAHASSENI, Behrooz et al.,Unsupervised Video Summarization with Adversarial LSTM Networks,2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),IEEE,2017年11月09日,pp. 2982-2991 |
XIE, Jianwen et al.,Synthesizing Dynamic Patterns by Spatial-Temporal Generative ConvNet,2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),IEEE,2017年11月09日,pp. 1061-1069 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020059581A1 (ja) | 2021-05-20 |
US20210344967A1 (en) | 2021-11-04 |
US11516515B2 (en) | 2022-11-29 |
WO2020059581A1 (ja) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109451308B (zh) | 视频压缩处理方法及装置、电子设备及存储介质 | |
KR100561875B1 (ko) | 위치 인터폴레이터 복호화 방법 및 장치 | |
CN113454691A (zh) | 自适应点云属性编解码的方法和装置 | |
Ayzik et al. | Deep image compression using decoder side information | |
JP2023532397A (ja) | ポストフィルタリングのためのコンテンツ適応型オンライン訓練方法、装置およびコンピュータプログラム | |
JP7434604B2 (ja) | ニューラル画像圧縮における画像置換を用いたコンテンツ適応型オンライン訓練 | |
CN113747163A (zh) | 基于上下文重组建模的图像编码、解码方法及压缩方法 | |
EP2498497A1 (en) | Method and system using prediction and error correction for the compact representation of quantization matrices in video compression | |
RU2313174C2 (ru) | Адаптивный способ и система для отображения значений параметров в индексы кодовых слов | |
JP7041380B2 (ja) | 符号化システム、学習方法、及びプログラム | |
Mahmud | An improved data compression method for general data | |
JP7104352B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
US8594196B2 (en) | Spatial Wyner Ziv coding | |
EP3186781B1 (en) | Extension of the mpeg/sc3dmc standard to polygon meshes | |
JP7141007B2 (ja) | 符号化装置、符号化方法及びプログラム | |
US11350134B2 (en) | Encoding apparatus, image interpolating apparatus and encoding program | |
Lee et al. | Lossless compression of medical images by prediction and classification | |
Siddeq et al. | DCT and DST based Image Compression for 3D Reconstruction | |
WO2024214422A1 (ja) | メッシュ復号装置、メッシュ復号方法及びプログラム | |
JP2023528180A (ja) | ポストフィルタリングを伴うニューラル画像圧縮におけるブロック単位のコンテンツ適応オンライン訓練の方法、装置、およびコンピュータプログラム | |
JP2005236723A (ja) | 動画像符号化装置、動画像符号化方法、動画像復号化装置及び動画像復号化方法 | |
WO2021111595A1 (ja) | フィルタ生成方法、フィルタ生成装置及びプログラム | |
WO2011049175A1 (ja) | 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 | |
Mukati | Light field coding and processing for view sequences | |
JP2024152415A (ja) | メッシュ復号装置、メッシュ復号方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211019 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7104352 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |