JP2020191630A - 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 - Google Patents
画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 Download PDFInfo
- Publication number
- JP2020191630A JP2020191630A JP2020083122A JP2020083122A JP2020191630A JP 2020191630 A JP2020191630 A JP 2020191630A JP 2020083122 A JP2020083122 A JP 2020083122A JP 2020083122 A JP2020083122 A JP 2020083122A JP 2020191630 A JP2020191630 A JP 2020191630A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- feature extraction
- channels
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims abstract description 98
- 238000000034 method Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 46
- 238000010168 coupling process Methods 0.000 claims description 17
- 238000005859 coupling reaction Methods 0.000 claims description 17
- 230000008878 coupling Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 5
- 230000002860 competitive effect Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 20
- 238000007906 compression Methods 0.000 description 13
- 230000006835 compression Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 238000011946 reduction process Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Analysis (AREA)
Abstract
Description
入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップを取得する第一特徴抽出ユニット;
サイズがK回調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得する第二特徴抽出ユニット;及び
前記第一特徴抽出ユニットからのN個のチャンネルの特徴マップと、前記第二特徴抽出ユニットからのK×N個のチャンネルの特徴マップとを結合して出力する第一結合ユニットを含む。
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得するコンテキストモデル処理ユニット;及び
前記コンテキストモデル処理ユニットの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得するエントロピーモデル処理ユニットを含む。
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
算術デコーダからの入力画像の潜在表現と、前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報とを結合する結合器;及び
前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得するデコーダを含む。
複数のインセプションユニットを用いて、入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップの取得し;
複数の畳み込み層を用いて、それぞれ、サイズが調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得し;及び
前記インセプションユニットからのN個のチャンネルの特徴マップと、前記複数の畳み込み層からのそれぞれ対応するN個のチャンネルの特徴マップとを結合して出力することを含む。
マルチスケールダイレイテッド畳み込みユニットを用いて、前記ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得し;
コンテキストモデルを用いて、量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得し;及び
エントロピーモデルを用いて、前記コンテキストモデルの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得することを含む。
マルチスケールダイレイテッド畳み込みユニットを用いて、ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得し;
結合器を用いて、算術デコーダからの入力画像の潜在表現及び前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報に対して結合を行い;及び
デコーダを用いて、前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得することを含む。
902:複数の畳み込み層を用いて、それぞれ、サイズが調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得し;及び
903:前記インセプションユニットからのN個のチャンネルの特徴マップと、前記複数の畳み込み層からのそれぞれ対応するN個のチャンネルの特徴マップとを結合して出力する。
1002:結合器を用いて、算術デコーダからの入力画像の潜在表現と、前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報とを結合し、及び
1003:デコーダを用いて、前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得する。
1102:コンテキストモデルを用いて、コーダーからの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得し;及び
1103:エントロピーモデルを用いて、前記コンテキストモデルの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得する。
Claims (10)
- 画像コーディング装置であって、
入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップを取得する第一特徴抽出ユニット;
サイズがK回調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得する第二特徴抽出ユニット;及び
前記第一特徴抽出ユニットからのN個のチャンネルの特徴マップと、前記第二特徴抽出ユニットからのK×N個のチャンネルの特徴マップとを結合して出力する第一結合ユニットを含む、装置。 - 請求項1に記載の画像コーディング装置であって、
前記第一特徴抽出ユニットは、複数のインセプションユニットを含み、各インセプションユニットは、順次結合され、前記入力画像又は前のインセプションユニットからの特徴マップに対して特徴抽出を行い、前記入力画像のグローバル情報及びハイレベル情報を取得する、装置。 - 請求項2に記載の画像コーディング装置であって、
各前記インセプションユニットは、3つの第三特徴抽出ユニット、プーリングユニット、第二結合ユニット、及び第四特徴抽出ユニットを含み、
前記3つの第三特徴抽出ユニットは、異なる畳み込みカーネル及び同じチャンネル数を用いて前記入力画像又は前のインセプションユニットからの特徴マップに対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得し、
前記プーリングユニットは、前記入力画像又は前のインセプションユニットからの特徴マップに対して次元削減処理を行い、N個のチャンネルの特徴マップを取得し、
前記第二結合ユニットは、前記3つの第三特徴抽出ユニットからのN個のチャンネルの特徴マップと、前記プーリングユニットからのN個のチャンネルの特徴マップとを結合し、4N個のチャンネルの特徴マップを取得し、
前記第四特徴抽出ユニットは、前記第二結合ユニットからの特徴マップに対して次元削減処理を行い、N個のチャンネルの特徴マップを取得する、装置。 - 請求項1に記載の画像コーディング装置であって、
前記第二特徴抽出ユニットは、
前記入力画像に対してサイズ調整を行うサイズ調整ユニット;及び
サイズが調整された入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップを取得する第五特徴抽出ユニットを含む、装置。 - 請求項4に記載の画像コーディング装置であって、
前記サイズ調整ユニット及び前記第五特徴抽出ユニットは、一組又は複数組であり、異なる組のサイズ調整ユニットは、異なる割合を用いて、前記入力画像に対してサイズ調整を行い、異なる組の第五特徴抽出ユニットは、異なる畳み込みカーネルを用いて、サイズが調整された前記入力画像に対して特徴抽出を行う、装置。 - 請求項1に記載の画像コーディング装置であって、
前記第一結合ユニットからの各チャンネルの特徴マップに重みを与える加重ユニット;及び
前記加重ユニットからの特徴マップに対して次元削減処理を行い、M個のチャンネルの特徴マップを得て出力する第六特徴抽出ユニットをさらに含む、装置。 - 画像デコーディング装置であって、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
算術デコーダからの入力画像の潜在表現と、前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報とを結合する結合器;及び
前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得するデコーダを含む、装置。 - 請求項7に記載の装置であって、
前記マルチスケールダイレイテッド畳み込みユニットは、3つの特徴抽出ユニットを含み、
前記3つの特徴抽出ユニットは、異なる拡張率のダイレイテッド畳み込みカーネル及び同じチャンネル数を用いて前記ハイパーデコーダの出力に対して特徴抽出を行い、前記マルチスケールの補助情報を取得する。装置。 - 確率モデル生成装置であって、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得するコンテキストモデル処理ユニット;及び
前記コンテキストモデル処理ユニットの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得するエントロピーモデル処理ユニットを含む、装置。 - 請求項9に記載の装置であって、
前記マルチスケールダイレイテッド畳み込みユニットは、3つの特徴抽出ユニットを含み、
前記3つの特徴抽出ユニットは、異なる拡張率のダイレイテッド畳み込みカーネル及び同じチャンネル数を用いて前記ハイパーデコーダの出力に対して特徴抽出を行い、前記マルチスケールの補助情報を取得する、装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024060706A JP2024071773A (ja) | 2019-05-22 | 2024-04-04 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910429870.3 | 2019-05-22 | ||
CN201910429870.3A CN111988609B (zh) | 2019-05-22 | 图像编码装置、概率模型生成装置和图像解码装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024060706A Division JP2024071773A (ja) | 2019-05-22 | 2024-04-04 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020191630A true JP2020191630A (ja) | 2020-11-26 |
JP7491041B2 JP7491041B2 (ja) | 2024-05-28 |
Family
ID=73436344
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020083122A Active JP7491041B2 (ja) | 2019-05-22 | 2020-05-11 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
JP2024060706A Pending JP2024071773A (ja) | 2019-05-22 | 2024-04-04 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024060706A Pending JP2024071773A (ja) | 2019-05-22 | 2024-04-04 | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11386583B2 (ja) |
JP (2) | JP7491041B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7476631B2 (ja) | 2019-05-22 | 2024-05-01 | 富士通株式会社 | 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 |
JP7493617B2 (ja) | 2021-04-16 | 2024-05-31 | テンセント・アメリカ・エルエルシー | ニューラル画像圧縮における置換の多学習率のための方法および装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111818346B (zh) * | 2019-04-11 | 2023-04-18 | 富士通株式会社 | 图像编码方法和装置、图像解码方法和装置 |
JP7446903B2 (ja) * | 2020-04-23 | 2024-03-11 | 株式会社日立製作所 | 画像処理装置、画像処理方法及び画像処理システム |
WO2021220008A1 (en) * | 2020-04-29 | 2021-11-04 | Deep Render Ltd | Image compression and decoding, video compression and decoding: methods and systems |
GB202019531D0 (en) * | 2020-12-10 | 2021-01-27 | Deep Render Ltd | Bit allocation |
CN113869141A (zh) * | 2021-09-07 | 2021-12-31 | 中国电信股份有限公司 | 特征提取方法和装置、编码器、通信系统 |
CN114449276B (zh) * | 2022-01-06 | 2024-04-02 | 北京工业大学 | 一种基于学习的超先验边信息补偿图像压缩方法 |
CN116310358B (zh) * | 2023-02-23 | 2023-12-15 | 哈尔滨市科佳通用机电股份有限公司 | 铁路货车螺栓丢失检测方法、存储介质及设备 |
CN117036952B (zh) * | 2023-08-15 | 2024-04-12 | 石河子大学 | 基于rgb图像重建高光谱图像的红枣水分含量等级检测方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3217710A1 (en) * | 2012-05-25 | 2013-11-28 | Sun Patent Trust | Image encoding and decoding using context adaptive binary arithmetic coding with a bypass mode |
KR102631381B1 (ko) * | 2016-11-07 | 2024-01-31 | 삼성전자주식회사 | 컨볼루션 신경망 처리 방법 및 장치 |
US11734545B2 (en) * | 2017-11-14 | 2023-08-22 | Google Llc | Highly efficient convolutional neural networks |
US10586350B2 (en) * | 2017-12-03 | 2020-03-10 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
US10796452B2 (en) * | 2017-12-03 | 2020-10-06 | Facebook, Inc. | Optimizations for structure mapping and up-sampling |
KR102424514B1 (ko) * | 2017-12-04 | 2022-07-25 | 삼성전자주식회사 | 언어 처리 방법 및 장치 |
US10678508B2 (en) * | 2018-03-23 | 2020-06-09 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
US10628705B2 (en) * | 2018-03-29 | 2020-04-21 | Qualcomm Incorporated | Combining convolution and deconvolution for object detection |
US10810996B2 (en) * | 2018-07-31 | 2020-10-20 | Nuance Communications, Inc. | System and method for performing automatic speech recognition system parameter adjustment via machine learning |
US10282864B1 (en) | 2018-09-17 | 2019-05-07 | StradVision, Inc. | Method and device for encoding image and testing method and testing device using the same |
US10977530B2 (en) * | 2019-01-03 | 2021-04-13 | Beijing Jingdong Shangke Information Technology Co., Ltd. | ThunderNet: a turbo unified network for real-time semantic segmentation |
US11461653B2 (en) * | 2019-01-23 | 2022-10-04 | StradVision, Inc. | Learning method and learning device for CNN using 1xK or Kx1 convolution to be used for hardware optimization, and testing method and testing device using the same |
-
2020
- 2020-05-11 JP JP2020083122A patent/JP7491041B2/ja active Active
- 2020-05-15 US US16/875,038 patent/US11386583B2/en active Active
-
2024
- 2024-04-04 JP JP2024060706A patent/JP2024071773A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7476631B2 (ja) | 2019-05-22 | 2024-05-01 | 富士通株式会社 | 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 |
JP7493617B2 (ja) | 2021-04-16 | 2024-05-31 | テンセント・アメリカ・エルエルシー | ニューラル画像圧縮における置換の多学習率のための方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
US11386583B2 (en) | 2022-07-12 |
JP2024071773A (ja) | 2024-05-24 |
JP7491041B2 (ja) | 2024-05-28 |
CN111988609A (zh) | 2020-11-24 |
US20200372686A1 (en) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020191630A (ja) | 画像コーディング装置、確率モデル生成装置及び画像デコーディング装置 | |
Xu et al. | Positional encoding as spatial inductive bias in gans | |
JP7268599B2 (ja) | 情報処理装置および方法 | |
Santos et al. | Highly-parallel GPU architecture for lossy hyperspectral image compression | |
KR20190087263A (ko) | 라인 입력 및 출력을 이용한 이미지 처리 방법 및 장치 | |
Setyaningsih et al. | Survey of hybrid image compression techniques | |
CN113934890B (zh) | 一种文字自动生成场景视频的方法及系统 | |
JP7408799B2 (ja) | ニューラルネットワークモデルの圧縮 | |
US20210185320A1 (en) | Processing signal data using an upsampling adjuster | |
CN109547784A (zh) | 一种编码、解码方法及装置 | |
CN113747163B (zh) | 基于上下文重组建模的图像编码、解码方法及压缩方法 | |
Jiang et al. | Universal golomb–rice coding parameter estimation using deep belief networks for hyperspectral image compression | |
CN112750175B (zh) | 基于八度卷积和语义分割的图像压缩方法及系统 | |
WO2023010981A1 (zh) | 编解码方法及装置 | |
CN111080729A (zh) | 基于Attention机制的训练图片压缩网络的构建方法及系统 | |
CN111107377A (zh) | 深度图像压缩方法及其装置、设备和存储介质 | |
CN111988609B (zh) | 图像编码装置、概率模型生成装置和图像解码装置 | |
Chang et al. | A Reversible Data Hiding Method for SMVQ Indices Based on Improved Locally Adaptive Coding. | |
TWI836972B (zh) | 水下影像增強方法及使用該方法的影像處理系統 | |
Chen et al. | Adaptive VQVAE: a learning-based image compression framework with vector quantization | |
CN116260969B (zh) | 一种自适应的通道渐进式编解码方法、装置、终端及介质 | |
WO2024060161A1 (zh) | 编解码方法、编码器、解码器以及存储介质 | |
WO2023248486A1 (ja) | 情報処理装置および方法 | |
Preethi et al. | Quantization table selection using firefly with teaching and learning based optimization algorithm for image compression | |
KR20240025629A (ko) | 광학 흐름를 이용한 비디오 압축 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240429 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7491041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |