JP7478835B2 - 符号化ビデオストリームにおいてニューラルネットワークトポロジ及びパラメータを伝達するための技術 - Google Patents
符号化ビデオストリームにおいてニューラルネットワークトポロジ及びパラメータを伝達するための技術 Download PDFInfo
- Publication number
- JP7478835B2 JP7478835B2 JP2022556632A JP2022556632A JP7478835B2 JP 7478835 B2 JP7478835 B2 JP 7478835B2 JP 2022556632 A JP2022556632 A JP 2022556632A JP 2022556632 A JP2022556632 A JP 2022556632A JP 7478835 B2 JP7478835 B2 JP 7478835B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- parameters
- video
- data
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims description 106
- 238000000034 method Methods 0.000 title claims description 63
- 230000001902 propagating effect Effects 0.000 title 1
- 230000006835 compression Effects 0.000 claims description 20
- 238000007906 compression Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 8
- 230000000153 supplemental effect Effects 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 30
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 19
- 230000033001 locomotion Effects 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000013074 reference sample Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 241000023320 Luma <angiosperm> Species 0.000 description 5
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/10—Interfaces, programming languages or software development kits, e.g. for simulating neural networks
- G06N3/105—Shells for specifying net layout
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2021年1月4日に出願された米国仮出願第63/133,682号、及び2021年9月16日に出願された米国出願第17/476,824号に対する優先権を主張し、これらの出願の全内容を参照により明示的に援用する。
本開示は、ニューラルネットワークに関連するビデオ符号化で使用される補足エンハンスメント情報(SEI, supplemental enhancement information)を含むもののようなビデオ符号化技術に関する。
pred[x][y]=(wL*R-1,y+wT*Rx,-1+wTL*R-1,-1+(64-wL-wT-wTL)*pred[x][y]+32)>>6 (式2-1)
ここで、Rx,-1、R-1,yは、それぞれ現在のサンプル(x,y)の上及び左に位置するフィルタリングされていない参照サンプルを表し、R-1,-1は、カレントブロックの左上角に位置するフィルタリングされていない参照サンプルを表す。重み付けは以下のように計算される。
wT=32>>(y<<1)>>shift) (式2-2)
wL=32>>((x<<1)>>shift) (式2-3)
wTL=-(wL>>4)-(wT>>4) (式2-4)
shift=(log2(width)+log2(height)+2)>>2 (式2-5)
図7は、1つの4×4ブロック内の位置(0,0)及び(1,0)についてDCモードのPDPC重み(wL,wT,wTL)を示す図700を示す。PDPCがDC、プラナー、水平及び垂直のイントラモードに適用される場合、HEVC DCモード境界フィルタ又は水平/垂直モードエッジフィルタのような更なる境界フィルタは必要ない。図7は、右上対角モードに適用されるPDPCの参照サンプルRx,-1、R-1,y及びR-1,-1の定義を示している。予測サンプルpred(x’,y’)は、予測ブロック内の(x’,y’)に位置する。参照サンプルRx,-1の座標xはx=x’+y’+1で与えられ、参照サンプルR-1,yの座標yは同様にy=x’+y’+1で与えられる。
pred(x,y)=(wL×R-1,y+wT×Rx,-1-wTL×R-1,-1+(64-wL-wT+wTL)×pred(x,y)+32)>>6
ここで、Rx,-1、R-1,yは、それぞれ現在のサンプル(x,y)の上及び左に位置する参照サンプルを表し、R-1,-1は、カレントブロックの左上角に位置する参照サンプルを表す。
wT=32>>((y<<1)>>nScale)、wL=32>>((x<<1)>>nScale)、wTL=(wL>>4)+(wT>>4)
ここで、nScale=(log2(width)-2+log2(height)-2>2)>>2であり、wTは、同じ水平座標を有する上参照ラインに位置する参照サンプルの重み係数を示し、wLは、同じ垂直座標を有する左参照ラインに位置する参照サンプルの重み係数を示し、wTLは、カレントブロックの左上参照サンプルの重み係数を示す。nScaleは、軸に沿って重み係数がどれだけ速く減少するかを指定し(wLが左から右に減少するか、或いは、wTが上から下に減少する)、すなわち、重み係数の減少率であり、これは、現在の設計ではx軸(左から右)及びy軸(上から下)に沿って同じである。また、32は、隣接サンプルの初期重み係数を示し、初期重み係数はまた、カレントCB内の左上のサンプルに割り当てられた上(左又は左上)の重みでもあり、PDPCプロセスにおける隣接サンプルの重み係数は、この初期重み係数以下とするべきである。
num_nn_input_ref_picは、入力参照ピクチャの数を指定する。0に等しいnum_nn_input_ref_picは、デコーダの現在の出力ピクチャがニューラルネットワークの唯一の入力データであることを指定し、0よりも大きいnum_nn_input_ref_picは、ニューラルネットワークの入力データとして使用される参照ピクチャの数がnum_nn_input_ref_pic-1であることを指定する。
S1105のようなnum_bytes_external_network_topology_uri_infoは、シンタックスエレメントexternal_network_topology_uri_infoのバイト数を指定する。
S1403のようなnn_topology_compression_format_idcは、以下の表6(NNトポロジ圧縮フォーマット識別子)で指定されるように、ニューラルネットワークトポロジの圧縮フォーマットを指定する。
S1110におけるnum_bytes_external_network_parameter_uri_infoは、シンタックスエレメントexternal_network_parameter_uri_infoのバイト数を指定する。
図17におけるフローチャート1700と同様に、図11における1112をも表すS1701のようなnetwork_parameter_info(input)の決定は、S1702におけるnn_parameter_type_idc、S1703におけるnn_parameter_storage_format_idc、S1704におけるnn_parameter_compression_format_idc、S1705におけるnn_bytes_parameter_data及びS1706におけるnn_parameter_data_byteを取得又は生成することを含む。
S1703のようなnn_parameter_storage_format_idcは、以下の表10(NNパラメータ記憶フォーマット識別子)で指定されるように、ニューラルネットワークパラメータの記憶フォーマットを指定する。
S1704のようなnn_parameter_compression_format_idcは、以下の表11(NNトポロジ圧縮フォーマット識別子)で指定されるように、ニューラルネットワークパラメータの圧縮フォーマットを指定する。
ペイロードの第iのバイトを指定する。
Claims (9)
- 少なくとも1つのプロセッサが実行するビデオ符号化のための方法であって、
ビデオビットストリームを取得するステップと、
少なくとも部分的にニューラルネットワークによって前記ビデオビットストリームを符号化するステップと、
前記ニューラルネットワークのトポロジ情報及びパラメータを決定するステップと、
前記符号化されたビデオビットストリームに関連する複数のシンタックスエレメントにおいて前記決定されたニューラルネットワークのトポロジ情報及びパラメータを伝達するステップと
を含み、
前記複数のシンタックスエレメントのうち少なくとも1つは、前記トポロジ情報及びパラメータが全て単一の補足エンハンスメント情報(SEI)メッセージに含まれるか、複数のSEIメッセージに分割されるかを伝達する、方法。 - 前記複数のシンタックスエレメントは、パラメータセット、メタデータコンテナボックス、及び前記単一のSEIメッセージ又は前記複数のSEIメッセージのうち1つ以上を介して伝達される、請求項1に記載の方法。
- 前記ニューラルネットワークは、複数のオペレーションノードを含み、
前記ニューラルネットワークによって前記ビデオビットストリームを符号化するステップは、
前記ビデオビットストリームの入力テンソルデータを前記オペレーションノードの第1のオペレーションノードに供給するステップと、
予め訓練された定数及び変数のいずれかで前記入力テンソルデータを処理するステップと、
中間テンソルデータを出力するステップとを含み、
前記中間テンソルデータは、前記入力テンソルデータと訓練された定数及び更新された変数のいずれかとの加重和を含む、請求項2に記載の方法。 - 前記トポロジ情報及びパラメータは、前記ニューラルネットワークによる前記ビデオビットストリームの前記符号化に基づく、請求項3に記載の方法。
- 前記決定されたトポロジ情報及びパラメータを伝達するステップは、前記決定されたトポロジ情報及びパラメータが記憶される外部リンク情報を提供するステップを含む、請求項1乃至4のうちいずれか1項に記載の方法。
- 前記決定されたトポロジ情報及びパラメータを伝達するステップは、
ニューラルネットワーク交換フォーマット(NNEF)、オープンニューラルネットワーク交換(ONNX)フォーマット及びMPEGニューラルネットワーク圧縮標準(NNR)フォーマットのうち少なくとも1つによって、前記決定されたトポロジ情報及びパラメータを明示的に伝達するステップを含む、請求項1乃至5のうちいずれか1項に記載の方法。 - 前記ニューラルネットワーク交換フォーマット(NNEF)、前記オープンニューラルネットワーク交換(ONNX)フォーマット及び前記MPEGニューラルネットワーク圧縮標準(NNR)フォーマットのうち前記少なくとも1つは、前記MPEG NNRフォーマットであり、
前記パラメータのうち少なくとも1つは、データファイル、及び前記単一のSEIメッセージ又は前記複数のSEIメッセージのうち少なくとも1つに圧縮される、請求項6に記載の方法。 - ビデオ符号化のための装置であって、
コンピュータプログラムコードを記憶するように構成された少なくとも1つのメモリと、
前記コンピュータプログラムコードにアクセスして前記コンピュータプログラムコードによって命令される通りに動作するように構成された少なくとも1つのプロセッサと
を含み、前記コンピュータプログラムコードは、
前記少なくとも1つのプロセッサに対して、請求項1乃至7のうちいずれか1項に記載の方法を実行させる、装置。 - コンピュータに、請求項1乃至7のうちいずれか1項に記載の方法を実行させるプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163133682P | 2021-01-04 | 2021-01-04 | |
US63/133,682 | 2021-01-04 | ||
US17/476,824 | 2021-09-16 | ||
US17/476,824 US11818399B2 (en) | 2021-01-04 | 2021-09-16 | Techniques for signaling neural network topology and parameters in the coded video stream |
PCT/US2021/053951 WO2022146522A1 (en) | 2021-01-04 | 2021-10-07 | Techniques for signaling neural network topology and parameters in coded video stream |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023518795A JP2023518795A (ja) | 2023-05-08 |
JP7478835B2 true JP7478835B2 (ja) | 2024-05-07 |
Family
ID=82219136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022556632A Active JP7478835B2 (ja) | 2021-01-04 | 2021-10-07 | 符号化ビデオストリームにおいてニューラルネットワークトポロジ及びパラメータを伝達するための技術 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11818399B2 (ja) |
EP (1) | EP4058945A4 (ja) |
JP (1) | JP7478835B2 (ja) |
KR (1) | KR20220164796A (ja) |
CN (1) | CN115398453A (ja) |
WO (1) | WO2022146522A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220337853A1 (en) * | 2021-04-07 | 2022-10-20 | Lemon Inc. | On Neural Network-Based Filtering for Imaging/Video Coding |
US11647216B2 (en) * | 2021-04-12 | 2023-05-09 | Tencent America LLC | Techniques for signaling neural network topology, parameters, and processing information in video stream |
WO2024039678A1 (en) * | 2022-08-16 | 2024-02-22 | Bytedance Inc. | Signaling of neural-network post-filter output picture resolution |
US12034976B2 (en) * | 2022-10-12 | 2024-07-09 | Sharp Kabushiki Kaisha | Systems and methods for signaling neural network post-filter frame rate upsampling information in video coding |
WO2024146480A1 (en) * | 2023-01-03 | 2024-07-11 | Douyin Vision Co., Ltd. | Method, apparatus, and medium for video processing |
WO2024146595A1 (en) * | 2023-01-04 | 2024-07-11 | Douyin Vision Co., Ltd. | Neural-network post-filter purposes with picture rate upsampling |
US20240244196A1 (en) * | 2023-01-12 | 2024-07-18 | Sharp Kabushiki Kaisha | Systems and methods for signaling neural network post-filter tensor information in video coding |
WO2024179540A1 (en) * | 2023-03-01 | 2024-09-06 | Douyin Vision Co., Ltd. | Neural-network post-processing filter activation parameters |
WO2024179552A1 (en) * | 2023-03-01 | 2024-09-06 | Douyin Vision Co., Ltd. | Neural-network post-processing filter activation parameters |
WO2024182708A1 (en) * | 2023-03-01 | 2024-09-06 | Bytedance Inc. | Video usability information related indications and miscellaneous items in neural-network post-processing filter sei messages |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200304836A1 (en) | 2019-03-22 | 2020-09-24 | Tencent America LLC | Supplemental enhancement information messages for neural network based video post processing |
JP2022007319A (ja) | 2020-06-26 | 2022-01-13 | シャープ株式会社 | 動画像符号化装置、復号装置 |
US20230116285A1 (en) | 2020-06-10 | 2023-04-13 | Huawei Technologies Co., Ltd. | Adaptive image enhancement using inter-channel correlation information |
JP2023535131A (ja) | 2020-07-10 | 2023-08-16 | コーニンクレッカ フィリップス エヌ ヴェ | 構成可能な機械学習ベースの算術コード化によるゲノム情報圧縮 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040103179A1 (en) * | 2002-11-26 | 2004-05-27 | Alcatel Canada Inc. | Topology management of dual ring network |
US8560646B1 (en) * | 2010-09-28 | 2013-10-15 | Amazon Technologies, Inc. | Managing communications using alternative packet addressing |
US20200175396A1 (en) | 2018-12-04 | 2020-06-04 | Intel Corporation | Deterministic neural networking interoperability |
US11282172B2 (en) | 2018-12-11 | 2022-03-22 | Google Llc | Guided restoration of video data using neural networks |
EP3939301A1 (en) | 2019-03-15 | 2022-01-19 | InterDigital VC Holdings, Inc. | Low displacement rank based deep neural network compression |
-
2021
- 2021-09-16 US US17/476,824 patent/US11818399B2/en active Active
- 2021-10-07 WO PCT/US2021/053951 patent/WO2022146522A1/en unknown
- 2021-10-07 CN CN202180026007.9A patent/CN115398453A/zh active Pending
- 2021-10-07 KR KR1020227039100A patent/KR20220164796A/ko active Search and Examination
- 2021-10-07 EP EP21899322.8A patent/EP4058945A4/en active Pending
- 2021-10-07 JP JP2022556632A patent/JP7478835B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200304836A1 (en) | 2019-03-22 | 2020-09-24 | Tencent America LLC | Supplemental enhancement information messages for neural network based video post processing |
US20230116285A1 (en) | 2020-06-10 | 2023-04-13 | Huawei Technologies Co., Ltd. | Adaptive image enhancement using inter-channel correlation information |
JP2023528641A (ja) | 2020-06-10 | 2023-07-05 | 華為技術有限公司 | チャネル間相関情報を用いた適応的画像向上 |
JP2022007319A (ja) | 2020-06-26 | 2022-01-13 | シャープ株式会社 | 動画像符号化装置、復号装置 |
JP2023535131A (ja) | 2020-07-10 | 2023-08-16 | コーニンクレッカ フィリップス エヌ ヴェ | 構成可能な機械学習ベースの算術コード化によるゲノム情報圧縮 |
Non-Patent Citations (1)
Title |
---|
Byeongdoo Choi, et al.,AHG9/AHG11: SEI message for carriage of neural network information for post filtering [online], JVET-U JVET-U0091,ITU-T インターネット<URL:https://jvet-experts.org/doc_end_user/documents/21_Teleconference/wg11/JVET-U0091-v1.zip>,2021年01月01日,pp.1-3 |
Also Published As
Publication number | Publication date |
---|---|
US11818399B2 (en) | 2023-11-14 |
JP2023518795A (ja) | 2023-05-08 |
EP4058945A4 (en) | 2023-01-25 |
US20220217403A1 (en) | 2022-07-07 |
KR20220164796A (ko) | 2022-12-13 |
WO2022146522A1 (en) | 2022-07-07 |
CN115398453A (zh) | 2022-11-25 |
EP4058945A1 (en) | 2022-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7478835B2 (ja) | 符号化ビデオストリームにおいてニューラルネットワークトポロジ及びパラメータを伝達するための技術 | |
KR102596380B1 (ko) | 참조 픽처 리샘플링을 위한 시그널링 | |
KR102653789B1 (ko) | 멀티-라인 인트라 예측을 위한 방법 및 장치 | |
KR102617651B1 (ko) | 일반화된 트라이수프 기하 코딩을 위한 기법 및 장치 | |
JP7516637B2 (ja) | 無指向性媒体符号化のためのラップアラウンドパディングの方法 | |
JP2021518088A (ja) | 小ブロックの予測と変換のための方法、装置、及びプログラム | |
CN110784711B (zh) | 生成用于视频序列编码或解码的合并候选列表的方法、装置 | |
JP7520138B2 (ja) | 顔復元に基づくビデオ会議のためのフレームワーク | |
JP7260561B2 (ja) | マルチラインイントラ予測のためのイントラ補間フィルタを選択する方法、装置、及びコンピュータプログラム | |
JP7522860B2 (ja) | ビデオストリームにおけるニューラル・ネットワーク・トポロジ、パラメータ、および処理情報をシグナリングするための技術 | |
JP7495456B2 (ja) | 映像圧縮における複数ラインイントラ予測の方法、装置及びコンピュータ・プログラム | |
KR20200125744A (ko) | 비디오 코딩에서의 세그먼트 타입들 | |
KR102650213B1 (ko) | 코딩된 비디오 스트림에서 계층별 랜덤 엑세스하기 위한 방법 | |
KR20220114062A (ko) | 심층 강화 학습을 통한 종단 간 종속 양자화 | |
JP7326463B2 (ja) | アクセスユニットのデリミター信号化のための方法、装置、およびコンピュータプログラム | |
JP7378485B2 (ja) | Qt/bt/ttサイズの改善されたヘッダシンタックス | |
JP7413532B2 (ja) | ルマブロックのための改善されたデルタ角度シグナリング方法 | |
KR102718217B1 (ko) | 다중 라인 인트라 예측을 위한 인트라 보간 필터 | |
JP7391994B2 (ja) | 参照ピクチャー再サンプリングのための出力ピクチャー・サイズの信号伝達に関する方法、装置およびコンピュータ・プログラム | |
JP7489466B2 (ja) | ニューラルネットワークベースのビデオコーディングのためのプルーニング方法、装置およびコンピュータプログラム | |
KR102720029B1 (ko) | 개선된 최고 확률 모드 리스트 생성 스킴 | |
KR20240154100A (ko) | 개선된 최고 확률 모드 리스트 생성 스킴 | |
KR20240052053A (ko) | 루마로부터 크로마 인트라 예측 모드에 대한 다운샘플링 필터의 시그널링 | |
KR20210154812A (ko) | 비디오 코딩을 위한 방법, 장치 및 매체 | |
JPWO2023044254A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7478835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |