JP7098805B2 - ニューラルネットワークを利用したコーデック - Google Patents
ニューラルネットワークを利用したコーデック Download PDFInfo
- Publication number
- JP7098805B2 JP7098805B2 JP2021137441A JP2021137441A JP7098805B2 JP 7098805 B2 JP7098805 B2 JP 7098805B2 JP 2021137441 A JP2021137441 A JP 2021137441A JP 2021137441 A JP2021137441 A JP 2021137441A JP 7098805 B2 JP7098805 B2 JP 7098805B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- encoded
- parameters
- neural network
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/70—Media network packetisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/762—Media network packet handling at the source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/764—Media network packet handling at the destination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/563—Motion estimation with padding, i.e. with filling of non-object values in an arbitrarily shaped picture block or region for estimation purposes
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明の実施形態は、エンコードされたビットストリーム内に含まれる情報量を減らすために、1つ以上の訓練されたニューラルネットワークを使用することを含む新しいエンコードプロトコルを実施する。訓練されたニューラルネットワークにより、コーデックが、前のエンコードパラメータからエンコードパラメータを予測することが可能になり得る。したがって、本開示の態様によれば、ニューラルネットワークによって正確に予測されたエンコードパラメータがエンコードされない場合があり、誤って予測されたパラメータは、ビットストリーム内にエンコードされたエンコード誤差ストリームによって修正され得る。
本開示の態様によれば、エンコードパラメータ、例えば、動きベクトル、イントラ予測モード動きベクトル、及び変換係数を含めることは、現在のフレーム及び/または前のフレームのエンコードパラメータから次のフレームのエンコードパラメータを予測するように訓練されたニューラルネットワークの使用によって低減させることが可能であり、及び/または現在のフレームのエンコードパラメータを、現在のフレームの他のエンコードパラメータから予測することができる。本エンコードシステムでは、以下に詳述する標準的な手段によりエンコードパラメータを導出するエンコード方式が、現在のセクションに対して実行され得、次に、このエンコードパラメータが、現在のエンコードパラメータのセットから次のエンコードパラメータのセットを予測するように訓練されたニューラルネットワーク(以下、第2のNNと呼ばれる)に提供され得る。その後、本システムでは、エンコードされていないビデオストリームの次のセクションのためのエンコードパラメータが導出され得、NNによって行われた次のセクションのためのエンコードパラメータの予測結果が点検され得る。予測が正確であった場合、本システムは、符号化されたビットストリームにそのエンコードパラメータを含めない。予測が正確でなかった場合、本システムは、ビットストリームにエンコードパラメータを含め得る。いくつかの実施形態では、予測が正確でない場合、ニューラルネットワークによって予測されたエンコードパラメータと、標準のエンコードプロセスによって導出される実際のエンコードパラメータとの差(以下、エンコード誤差と呼ぶ)が、符号化されたビットストリームに含められる。このようにして、符号化されたビットストリーム内にエンコードパラメータの削減されたセットが含められ得、したがってビデオストリームのメモリフットプリントが削減され得る。
図2は、エンコードパラメータを認識して正しく予測するように新しいニューラルネットワークを訓練するための方法200を示す。ニューラルネットワーク(NN)の訓練は、NN210の重みの初期化から始める。初期の重みは、活性化関数のタイプ及びノードへの入力の数によって決まる。NNの初期の重みは、隠れ層での非対称の計算を招くために、これを0にすることはできない。一般に、初期の重みはランダムに分散させる必要がある。例えば、tanh活性化関数を用いるNNは、-1/√nから1/√nの間に分布する乱数値を有するべきである。ただし、nはノードへの入力の数である。
デジタルピクチャは、図4に説明される一般化された方法400に従ってエンコードされ得る。エンコーダは、複数のデジタル画像401を受け取り、各画像をエンコードする。デジタルピクチャ401のエンコードは、セクション単位で進行し得る。セクションごとのエンコードプロセスは、任意選択で、パディング402、画像圧縮404、及びピクセル再構成406を含み得る。イントラ符号化ピクチャ及びインター符号化ピクチャの両方に共通のプロセスフローを促進するために、現在処理中のピクチャ401のうちのデコードされていない全てのピクセルは、仮ピクセル値でパディングされて、402において示すようにパディングされたピクチャが生成される。パディングされたピクチャは、バッファに格納された参照ピクチャのリスト403に追加される。ピクチャを402でパディングすることにより、現在処理中のピクチャを、画像圧縮404時及びピクセル再構成406時の後続処理において参照ピクチャとして使用することが容易になる。そのようなパディングは、参照により本明細書に組み込まれる、本発明の譲受人に譲渡された米国特許第8,218,641号に詳細に記載されている。
本デコーダシステムは、第2の訓練されたNNを使用して、上記のようにエンコードされたビットストリームから正しいエンコードパラメータを予測する。最初に、エンコードされたビットストリームは、パラメータ値をビットストリームから抽出できるようにするエントロピーデコーダでデコードされ得る。ビデオストリームのまさしく最初のセクションまたはいくつかのセクションのパラメータ値には、ビットストリームに含まれる全てのビデオエンコードパラメータを有している場合があることに留意されたい。これにより、NNは次のセクションの次のパラメータ値を正確に予測できるようになる。エンコードパラメータは、限定としてではなく一例として、符号化されたスライスデータ、またはビットストリーム内のビデオの各フレームのフレームヘッダ、またはビットストリーム内の他の任意の適切な位置に含まれ得る。エンコードされたビットストリームはまた、次のセクションのためのエンコードパラメータの修正されたセットを生成するためにNNによって行われた予測と組み合わされ得る予測誤差ストリームを含み得る。予測誤差は、例えば、ピクチャのヘッダ情報にエンコードされ得る。
図5は、本発明の実施形態と併せて使用し得るストリーミングデータ501のデコードのための方法500における可能なプロセスフローの例を説明する。この特定の例は、例えば、AVC(H.264)規格を使用したビデオデコードのプロセスフローを示す。符号化されたストリーミングデータ501は、最初はバッファに格納され得る。符号化されたストリーミングデータ501(例えば、ビデオデータビットストリーム)がネットワーク、例えばインターネットを介して転送された場合、データ501は、最初に、502で示されるネットワーク抽象化層(NAL)デコードと呼ばれるプロセスを受け得る。NALデコードは、データの伝送を補助するために追加された情報をデータ501から取り除き得る。「ネットワークラッパー」と呼ばれるそのような情報は、データ501をビデオデータとして識別し、またはビットストリームの開始または終了、データの整列のためのビット、及び/またはビデオデータ自体に関するメタデータを示し得る。そのようなメタデータは、パッチフレームを形成するために使用できるイントラ符号化サブセクションを含む2つ以上の連続する継続的なフレームのシーケンスにおける最初の符号化フレームとして特定の符号化フレームを識別するビットをヘッダ内に含み得る。メタデータはまた、エンコードパラメータが変更されていない初期エンコードパラメータであるか、または予測誤差であるかを伝える上記のフラグをヘッダ内に含み得る。
図6は、本開示の態様によるシステムを示す。本システムは、ユーザ入力デバイス602に結合されたコンピューティングデバイス600を含み得る。ユーザ入力デバイス602は、コントローラ、タッチスクリーン、マイクロフォン、キーボード、マウス、ライトペン、またはユーザがシステムに制御データを入力することを可能にする他のデバイスであり得る。
Claims (20)
- ビデオエンコードの方法であって、
a)ビデオエンコーダで、エンコードされていないビデオストリームから、セクションのビデオエンコードパラメータを判定することと、
b)1つ以上の訓練されたニューラルネットワークに、前記セクションの前記ビデオエンコードパラメータを提供することであって、前記1つ以上の訓練されたニューラルネットワークは、他のビデオエンコードパラメータを予測するように訓練されている、前記セクションの前記ビデオエンコードパラメータを提供することと、
c)前記1つ以上の訓練されたニューラルネットワークで、前記提供されたビデオエンコードパラメータから他のビデオエンコードパラメータを予測することと、
d)前記1つ以上のニューラルネットワークからの前記予測された他のビデオエンコードパラメータと、前記ビデオエンコーダからの実際のエンコードパラメータとの予測誤差を判定することと、
e)予測誤差のないセクションのエンコードパラメータを使用せずに、前記エンコードされていないビデオストリームをエンコードすることと
を含む、方法。 - d)は、予測に誤差がある前記ビデオストリームのセクションの前記予測誤差をエンコードすることをさらに含む、請求項1に記載の方法。
- d)は、予測に誤差がある前記ビデオストリームのセクションの正しいエンコードパラメータをエンコードすることをさらに含む、請求項1に記載の方法。
- 前記1つ以上の訓練されたニューラルネットワークは、予測ニューラルネットワーク及び双予測ニューラルネットワークを含む、請求項1に記載の方法。
- c)は、前記予測ニューラルネットワークによって予測されたエンコードパラメータを、入力として、前記双予測ニューラルネットワークに提供することを含む、請求項4に記載の方法。
- 前記ビデオストリームの初期のセクションのエンコードパラメータが常にエンコードされる、請求項1に記載の方法。
- b)で提供される前記ビデオエンコードパラメータ及びc)で行われる予測は、スライス間の依存関係を取り除くために、スライス境界内に制限される、請求項1に記載の方法。
- ニューラルネットワークでビデオストリームをデコードする方法であって、
a)エンコードされたビデオストリームを受け取ることであって、前記エンコードされたビデオストリームは、前記エンコードされたビデオストリームの少なくともセクションのビデオエンコードパラメータを有する、前記エンコードされたビデオストリームを受け取ることと、
b)前記エンコードされたビデオストリームから、前記少なくともセクションの前記ビデオエンコードパラメータを抽出することと、
c)他のビデオエンコードパラメータを予測するように訓練された1つ以上のニューラルネットワークに、前記少なくともセクションのビデオエンコードパラメータを提供することと、
d)前記1つ以上のニューラルネットワークで、前記提供されたビデオエンコードパラメータから前記他のビデオエンコードパラメータを予測することと、
e)前記予測されたビデオエンコードパラメータ及び前記エンコードされたビデオストリームを使用して、前記ビデオストリームをデコードすることと、
f)前記デコードされたビデオストリームをディスプレイに表示することと
を含む、方法。 - 前記1つ以上のニューラルネットワークは、予測ニューラルネットワーク及び双予測ニューラルネットワークを含む、請求項8に記載の方法。
- d)は、前記予測ニューラルネットワークによって予測されたエンコードパラメータを、入力として、前記双予測ニューラルネットワークに提供することを含む、請求項9に記載の方法。
- b)は、前記エンコードされたビデオストリームから予測誤差を抽出することをさらに含む、請求項8に記載の方法。
- d)は、前記予測されたビデオエンコードパラメータを前記予測誤差で修正することをさらに含む、請求項11に記載の方法。
- c)で提供される前記ビデオエンコードパラメータ及びd)で行われる予測は、スライス間の依存関係を取り除くために、スライス境界内に制限される、請求項8に記載の方法。
- プロセッサと、
パラメータ値を予測するように訓練されたニューラルネットワークと、
前記プロセッサに動作可能に結合されたメモリであって、
前記メモリは、ビデオエンコードの命令を実施しており、前記メモリは、改善されたビデオエンコードの方法を実行するための命令をさらに含み、前記方法は、
a)ビデオエンコーダで、エンコードされていないビデオストリームから、セクションのビデオエンコードパラメータを判定することと、
b)1つ以上の訓練されたニューラルネットワークに、前記ビデオエンコードパラメータを提供することであって、前記ニューラルネットワークは、他のビデオエンコードパラメータを予測するように訓練されている、前記ビデオエンコードパラメータを提供することと、
c)前記訓練されたニューラルネットワークで、前記他のビデオエンコードパラメータを予測することと、
d)前記ニューラルネットワークからの前記予測されたエンコードパラメータと、前記ビデオエンコーダからの実際のエンコードパラメータとの予測誤差を判定することと、
e)予測誤差のないセクションのエンコードパラメータを使用せずに、前記エンコードされていないビデオストリームをエンコードすることと
を含む、前記メモリと
を備える、システム。 - 前記1つ以上の訓練されたニューラルネットワークは、予測ニューラルネットワーク及び双予測ニューラルネットワークを含む、請求項14に記載のシステム。
- c)は、前記予測ニューラルネットワークによって予測されたエンコードパラメータを、入力として、前記双予測ニューラルネットワークに提供することを含む、請求項15に記載のシステム。
- プロセッサと、
エンコードパラメータ値を予測するように訓練されたニューラルネットワークと、
前記プロセッサに動作可能に結合されたメモリであって、
前記メモリは、ビデオデコードの命令を実施しており、前記メモリは、改善されたビデオデコードの方法を実行するための命令をさらに含み、前記方法は、
a)エンコードされたビデオストリームを受け取ることであって、前記エンコードされたビデオストリームは、前記エンコードされたビデオストリームの少なくともセクションのビデオエンコードパラメータを有する、前記エンコードされたビデオストリームを受け取ることと、
b)前記エンコードされたビデオストリームから、前記少なくともセクションの前記ビデオエンコードパラメータを抽出することと、
c)1つ以上のニューラルネットワークに、前記少なくともセクションの前記ビデオエンコードパラメータを提供することであって、前記ニューラルネットワークは、他のビデオエンコードパラメータを予測するように訓練されている、前記ビデオエンコードパラメータを提供することと、
d)前記訓練されたニューラルネットワークで、前記少なくともセクションのビデオエンコードパラメータから他のビデオエンコードパラメータを予測することと、
e)前記予測されたビデオエンコードパラメータ及び前記エンコードされたビデオストリームを使用して、前記ビデオストリームをデコードすることと、
f)前記デコードされたビデオストリームをディスプレイに表示することと
を含む、前記メモリと
を備える、システム。 - 前記1つ以上のニューラルネットワークは、予測ニューラルネットワーク及び双予測ニューラルネットワークを含む、請求項17に記載のシステム。
- d)は、前記予測ニューラルネットワークによって予測されたエンコードパラメータを、入力として、前記双予測ニューラルネットワークに提供することを含む、請求項18に記載のシステム。
- b)は、前記エンコードされたビデオストリームから予測誤差を抽出することをさらに含み、d)は、前記予測された次のセクションのビデオエンコードパラメータを前記予測誤差で修正することをさらに含む、請求項17に記載のシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022104352A JP7336004B2 (ja) | 2018-06-19 | 2022-06-29 | ニューラルネットワークを利用したコーデック |
JP2023112837A JP2023126970A (ja) | 2018-06-19 | 2023-07-10 | ニューラルネットワークを利用したコーデック |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/012,570 US10499081B1 (en) | 2018-06-19 | 2018-06-19 | Neural network powered codec |
US16/012,570 | 2018-06-19 | ||
JP2020570848A JP6960548B2 (ja) | 2018-06-19 | 2019-06-11 | ニューラルネットワークを利用したコーデック |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570848A Division JP6960548B2 (ja) | 2018-06-19 | 2019-06-11 | ニューラルネットワークを利用したコーデック |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022104352A Division JP7336004B2 (ja) | 2018-06-19 | 2022-06-29 | ニューラルネットワークを利用したコーデック |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022003775A JP2022003775A (ja) | 2022-01-11 |
JP7098805B2 true JP7098805B2 (ja) | 2022-07-11 |
Family
ID=68695758
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570848A Active JP6960548B2 (ja) | 2018-06-19 | 2019-06-11 | ニューラルネットワークを利用したコーデック |
JP2021137441A Active JP7098805B2 (ja) | 2018-06-19 | 2021-08-25 | ニューラルネットワークを利用したコーデック |
JP2022104352A Active JP7336004B2 (ja) | 2018-06-19 | 2022-06-29 | ニューラルネットワークを利用したコーデック |
JP2023112837A Pending JP2023126970A (ja) | 2018-06-19 | 2023-07-10 | ニューラルネットワークを利用したコーデック |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570848A Active JP6960548B2 (ja) | 2018-06-19 | 2019-06-11 | ニューラルネットワークを利用したコーデック |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022104352A Active JP7336004B2 (ja) | 2018-06-19 | 2022-06-29 | ニューラルネットワークを利用したコーデック |
JP2023112837A Pending JP2023126970A (ja) | 2018-06-19 | 2023-07-10 | ニューラルネットワークを利用したコーデック |
Country Status (5)
Country | Link |
---|---|
US (3) | US10499081B1 (ja) |
EP (2) | EP3811614B1 (ja) |
JP (4) | JP6960548B2 (ja) |
CN (2) | CN115623200B (ja) |
WO (1) | WO2019245805A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10499081B1 (en) | 2018-06-19 | 2019-12-03 | Sony Interactive Entertainment Inc. | Neural network powered codec |
US11829869B2 (en) * | 2018-07-25 | 2023-11-28 | Servicenow Canada Inc. | Multiple task transfer learning |
US11334798B2 (en) * | 2018-07-31 | 2022-05-17 | Dell Products L.P. | Configurable layered neural network engine for customer support |
US10740901B2 (en) * | 2018-12-17 | 2020-08-11 | Nvidia Corporation | Encoder regularization of a segmentation model |
US10965945B2 (en) * | 2019-03-29 | 2021-03-30 | Bitmovin, Inc. | Optimized multipass encoding |
US20220201487A1 (en) * | 2019-04-11 | 2022-06-23 | Ntt Docomo, Inc. | Network node |
CN111222561B (zh) * | 2019-12-31 | 2023-06-09 | 深圳云天励飞技术股份有限公司 | 图像识别神经网络处理方法、装置与系统 |
US11240465B2 (en) * | 2020-02-21 | 2022-02-01 | Alibaba Group Holding Limited | System and method to use decoder information in video super resolution |
US20220094977A1 (en) * | 2020-09-23 | 2022-03-24 | Electronics And Telecommunications Research Institute | Method, apparatus and storage medium for image encoding/decoding |
CN114868386B (zh) * | 2020-12-03 | 2024-05-28 | Oppo广东移动通信有限公司 | 编码方法、解码方法、编码器、解码器以及电子设备 |
WO2022116165A1 (zh) * | 2020-12-04 | 2022-06-09 | 深圳市大疆创新科技有限公司 | 视频编码方法、解码方法、编码器、解码器以及ai加速器 |
CN113783876B (zh) * | 2021-09-13 | 2023-10-03 | 国网数字科技控股有限公司 | 基于图神经网络的网络安全态势感知方法及相关设备 |
CN113743595B (zh) * | 2021-10-09 | 2023-08-15 | 福州大学 | 基于物理驱动自编码器神经网络的结构参数识别方法 |
CN115407874B (zh) * | 2022-08-18 | 2023-07-28 | 中国兵器工业标准化研究所 | 一种基于神经网络的vr维修训练操作熟练度预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009111691A (ja) | 2007-10-30 | 2009-05-21 | Hitachi Ltd | 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 |
US20170230675A1 (en) | 2016-02-05 | 2017-08-10 | Google Inc. | Compressing images using neural networks |
WO2017144881A1 (en) | 2016-02-23 | 2017-08-31 | Magic Pony Technology Limited | Training end-to-end video processes |
JP2018125718A (ja) | 2017-02-01 | 2018-08-09 | 日本放送協会 | モード予測情報生成装置およびプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6553566B1 (en) * | 1998-08-27 | 2003-04-22 | X Out Corporation | Viewer controlled multi-function system for processing television signals |
KR100529311B1 (ko) | 2003-01-21 | 2005-11-17 | 삼성전자주식회사 | 신경 회로망을 이용하여 가변 길이 부호화 비트 스트림의길이를 선택하는 장치 및 방법 |
US8749409B2 (en) | 2006-08-25 | 2014-06-10 | Sony Computer Entertainment Inc. | Entropy decoding methods and apparatus using most probable and least probable signal cases |
US8218641B2 (en) | 2006-10-31 | 2012-07-10 | Sony Computer Entertainment Inc. | Picture encoding using same-picture reference for pixel reconstruction |
US8711933B2 (en) | 2010-08-09 | 2014-04-29 | Sony Computer Entertainment Inc. | Random access point (RAP) formation using intra refreshing technique in video coding |
US8787459B2 (en) * | 2010-11-09 | 2014-07-22 | Sony Computer Entertainment Inc. | Video coding methods and apparatus |
US8819525B1 (en) | 2012-06-14 | 2014-08-26 | Google Inc. | Error concealment guided robustness |
CA2997193C (en) * | 2015-09-03 | 2021-04-06 | Mediatek Inc. | Method and apparatus of neural network based processing in video coding |
US10499056B2 (en) | 2016-03-09 | 2019-12-03 | Sony Corporation | System and method for video processing based on quantization parameter |
EP3459021B1 (en) * | 2016-05-20 | 2023-12-20 | Deepmind Technologies Limited | Training neural networks using synthetic gradients |
US10121103B2 (en) * | 2016-12-09 | 2018-11-06 | Cisco Technologies, Inc. | Scalable deep learning video analytics |
US10748062B2 (en) * | 2016-12-15 | 2020-08-18 | WaveOne Inc. | Deep learning based adaptive arithmetic coding and codelength regularization |
US10382770B2 (en) * | 2017-02-06 | 2019-08-13 | Google Llc | Multi-level machine learning-based early termination in partition search for video encoding |
CN107396124B (zh) * | 2017-08-29 | 2019-09-20 | 南京大学 | 基于深度神经网络的视频压缩方法 |
CN107734333A (zh) * | 2017-09-29 | 2018-02-23 | 杭州电子科技大学 | 一种利用生成网络提高视频错误隐藏效果的方法 |
US10721471B2 (en) * | 2017-10-26 | 2020-07-21 | Intel Corporation | Deep learning based quantization parameter estimation for video encoding |
US10499081B1 (en) | 2018-06-19 | 2019-12-03 | Sony Interactive Entertainment Inc. | Neural network powered codec |
-
2018
- 2018-06-19 US US16/012,570 patent/US10499081B1/en active Active
-
2019
- 2019-06-11 EP EP19821617.8A patent/EP3811614B1/en active Active
- 2019-06-11 JP JP2020570848A patent/JP6960548B2/ja active Active
- 2019-06-11 WO PCT/US2019/036589 patent/WO2019245805A1/en unknown
- 2019-06-11 EP EP22211114.8A patent/EP4171032A3/en active Pending
- 2019-06-11 CN CN202211111736.7A patent/CN115623200B/zh active Active
- 2019-06-11 CN CN201980048796.9A patent/CN112715027B/zh active Active
- 2019-11-14 US US16/684,279 patent/US11032569B2/en active Active
-
2021
- 2021-06-08 US US17/341,825 patent/US11432008B2/en active Active
- 2021-08-25 JP JP2021137441A patent/JP7098805B2/ja active Active
-
2022
- 2022-06-29 JP JP2022104352A patent/JP7336004B2/ja active Active
-
2023
- 2023-07-10 JP JP2023112837A patent/JP2023126970A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009111691A (ja) | 2007-10-30 | 2009-05-21 | Hitachi Ltd | 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法 |
US20170230675A1 (en) | 2016-02-05 | 2017-08-10 | Google Inc. | Compressing images using neural networks |
WO2017144881A1 (en) | 2016-02-23 | 2017-08-31 | Magic Pony Technology Limited | Training end-to-end video processes |
JP2018125718A (ja) | 2017-02-01 | 2018-08-09 | 日本放送協会 | モード予測情報生成装置およびプログラム |
Non-Patent Citations (1)
Title |
---|
Mu Li et al.,Learning Convolutional Networks for Content-weighted Image Compression,arXiv,2017年09月19日,arXiv:1703.10553v2,pp.1-11 |
Also Published As
Publication number | Publication date |
---|---|
EP3811614A4 (en) | 2022-08-24 |
JP2023126970A (ja) | 2023-09-12 |
US11432008B2 (en) | 2022-08-30 |
CN112715027A (zh) | 2021-04-27 |
JP7336004B2 (ja) | 2023-08-30 |
US10499081B1 (en) | 2019-12-03 |
CN115623200A (zh) | 2023-01-17 |
CN115623200B (zh) | 2023-05-12 |
JP6960548B2 (ja) | 2021-11-05 |
CN112715027B (zh) | 2022-09-30 |
JP2022003775A (ja) | 2022-01-11 |
US20200084473A1 (en) | 2020-03-12 |
EP3811614B1 (en) | 2024-03-06 |
EP4171032A2 (en) | 2023-04-26 |
US11032569B2 (en) | 2021-06-08 |
WO2019245805A1 (en) | 2019-12-26 |
EP4171032A3 (en) | 2023-06-07 |
US20190387252A1 (en) | 2019-12-19 |
US20210297695A1 (en) | 2021-09-23 |
JP2022133346A (ja) | 2022-09-13 |
EP3811614A1 (en) | 2021-04-28 |
JP2021522756A (ja) | 2021-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7098805B2 (ja) | ニューラルネットワークを利用したコーデック | |
US9872018B2 (en) | Random access point (RAP) formation using intra refreshing technique in video coding | |
US8218640B2 (en) | Picture decoding using same-picture reference for pixel reconstruction | |
US8218641B2 (en) | Picture encoding using same-picture reference for pixel reconstruction | |
US8787459B2 (en) | Video coding methods and apparatus | |
US10616583B2 (en) | Encoding/decoding digital frames by down-sampling/up-sampling with enhancement information | |
JP2022523925A (ja) | 映像コンテンツを処理するための方法及びシステム | |
US10178390B2 (en) | Advanced picture quality oriented rate control for low-latency streaming applications | |
US8594189B1 (en) | Apparatus and method for coding video using consistent regions and resolution scaling | |
US11212536B2 (en) | Negative region-of-interest video coding | |
CN113259671B (zh) | 视频编解码中的环路滤波方法、装置、设备及存储介质 | |
JP2023542029A (ja) | 低ビット精度のニューラルネットワーク(nn)に基づくクロスコンポーネント予測のための方法、機器、及びコンピュータプログラム | |
CN115956363A (zh) | 用于后滤波的内容自适应在线训练方法及装置 | |
KR101396632B1 (ko) | 비표준 벡터 양자화 코더를 이용한 비디오 표준을 따르는레지듀얼 코딩 | |
WO2020255771A1 (ja) | 画像処理装置および方法 | |
CN111194552A (zh) | 运动补偿参考帧压缩 | |
KR20080008137A (ko) | 영상 복원 장치 및 방법 | |
Norouzi et al. | Implementation of Hybrid MC/DCT video codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220502 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7098805 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |