JP2022530779A

JP2022530779A - メタネットワークまたはニューラルネットワークを利用する損失画像およびビデオ圧縮ならびに／または伝送のためのシステムならびに方法

Info

Publication number: JP2022530779A
Application number: JP2021564126A
Authority: JP
Inventors: ザファル，アルサラン; ベゼンブルック，クリスティアン
Original assignee: ディープレンダーエルティーディー
Priority date: 2019-04-29
Filing date: 2020-04-29
Publication date: 2022-07-01
Also published as: CN114127788A; US10489936B1; WO2020222001A1; EP3967043A1

Abstract

所与のノイズ画像から所望の画像を再構築する画像符号化ネットワークに必要なハイパーパラメータのセットを生成するためにメタネットワークを利用する、損失画像およびビデオ圧縮のためのシステムおよび方法。既知のノイズ画像を所望のまたはターゲット画像にマッピングする機能として、ニューラルネットワークを利用し、画像の圧縮バージョン自体の代わりに機能のハイパーパラメータのみの転送を可能にする、損失画像およびビデオ圧縮ならびに伝送のためのシステムおよび方法。これは、受信システムが同じノイズ画像および類似のニューラルネットワークを所有するという条件で、ハイパーパラメータを受信する任意のシステムによって所望の画像の高品質の近似値の再現を可能にする。所与の品質の画像を転送するために必要なデータ量は、既存の画像圧縮技術と対比して、劇的に削減される。ビデオは単に一連の画像であるため、この画像圧縮システムおよび方法の出願は、同じ画像品質に関して既存の技術よりも大きな速度でビデオコンテンツの転送を可能にする。【選択図】図２

Description

本開示は、データ圧縮の分野に関し、より具体的には、ニューラルネットワーク、例えば、非一般的なニューラルネットワークを利用する、損失画像圧縮、および／または伝送の分野に関する。

最先端技術の考察
２０年余り前にインターネットの普及が開始されて以来、世界中で伝送されるデータの量は飛躍的に増加している。過去１０年において、伝送されるデータの量が指数関数的に増加し続けているとしても、ビデオコンテンツは、それらのデータの増え続ける部分を占めている。少なくとも１つの調査によると、ビデオコンテンツは、２０１４年における世界のインターネットトラフィックの６４％を占め、２０１９年における世界のインターネットトラフィックの最大８５％を占めるように順調に進んでいる。

伝送されるデータの量が指数関数的に増加し続け、世界のインターネットトラフィックのほとんどが、現在、ビデオコンテンツであることを考えると、ビデオ圧縮技術は、非常に重要になっている。しかしながら、既存のビデオ圧縮技術は、変化に追いついていない。現在の主要なビデオ圧縮技術であるＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＶＥＣ、Ｈ．２６５としても知られている）およびそのオープンソースのライバルであるＡＶＩは、今世紀初頭に発展したビデオ圧縮技術（すなわち、Ｈ．２６４／ＭＰＥＧ－４ＡＶＣおよびＧｏｏｇｌｅのオープンソースのＶＰコーディングフォーマット）の段階的な改善である。新しいビデオ圧縮基準は、古いものと同じレベルの品質でスループットを向上させたが、そのビデオ圧縮方法は、既に収穫逓減のポイントに達し得、大幅なさらなる改善をもたらす可能性は低い。

非一般的なニューラルネットワークを利用するための方法は、画像圧縮またはビデオフレーム圧縮のために転送されるデータの量を大幅に削減することを提供するが、本明細書に記載されるこのような方法は、単一の画像を圧縮するための最適なネットワーク構成を求めるために最適化するのに大量の時間を要する。したがって、効率をさらに改善するために、大規模なデータセット上で、場合によってはデータセンタ内の接続されたコンピューティングデバイスなどの強力なプラットフォーム上で動作および訓練することができるメタネットワークは、画像の近似値を再構築し得るニューラルネットワークの構造を迅速に求めるように訓練することができ、それによって、現在の圧縮方法でさえ現在必要とされている帯域幅の一部を利用しながら、ネットワークを越えて大量のビデオまたは画像の転送を必要とする多くの企業または機関がこれを達成することを可能にし得る。

必要とされるのは、例えば、画像またはビデオを圧縮するのに大量の時間を要することなく、その性能が、最新の画像およびビデオ圧縮の性能を劇的に上回る画像およびビデオ圧縮のためのシステムおよび方法である。

したがって、本発明者は、所与のノイズ画像から所望の画像を再構築する画像符号化ネットワークに必要なハイパーパラメータのセットを生成するためにメタネットワークを利用する、損失画像およびビデオ圧縮のためのシステムおよび方法を構想し、実用化した。

好ましい実施形態によれば、メタネットワークを利用する損失画像およびビデオ圧縮のためのシステムであって、システムは、プロセッサと、メモリと、メモリに記憶された第１の複数のプログラミング命令と、を含む、メタネットワークエンジンを含み、第１の複数のプログラミング命令が、プロセッサ上で動作するときに、プロセッサに、所望の画像を受信することと、ノイズ画像を受信することと、訓練画像のセットを受信することと、訓練画像のセットの各々にノイズ画像をマッピングすることによって、訓練画像のセットの各々を再構築するために、訓練画像のセットを使用して、複数のニューラルネットワークを訓練することと、メタネットワークハイパーパラメータのセットとして、複数のニューラルネットワークの各々についてのパラメータを記憶することと、複数のニューラルネットワークの各々についての動作パラメータとして、メタネットワークハイパーパラメータのセットを使用することと、複数のニューラルネットワークを使用して、所望の画像にノイズ画像をマッピングし、複数のニューラルネットワークの各々の動作から生成された特定のフィルタに対応する第２のハイパーパラメータのセットを生成し、そのため、第２のハイパーパラメータのセットが、ニューラルネットワークを使用してノイズ画像に適用されるとき、所定の閾値未満である誤差内の所望の画像の近似値を生成することと、第２のセットのハイパーパラメータを、将来の画像マッピング動作で使用するために記憶することと、を行わせる。

別の好ましい実施形態によれば、メタネットワークを利用する損失画像圧縮のための方法であって、方法は、所望の画像を受信するステップと、ノイズ画像を受信するステップと、訓練画像のセットを受信するステップと、訓練画像のセットの各々にノイズ画像をマッピングすることによって、訓練画像のセットの各々を再構築するために、訓練画像のセットを使用して、複数のニューラルネットワークを訓練するステップと、メタネットワークハイパーパラメータのセットとして、複数のニューラルネットワークの各々についてのパラメータを記憶するステップと、複数のニューラルネットワークの各々についての動作パラメータとして、メタネットワークハイパーパラメータのセットを使用するステップと、複数のニューラルネットワークを使用して、所望の画像にノイズ画像をマッピングし、複数のニューラルネットワークの各々の動作から生成された特定のフィルタに対応する第２のハイパーパラメータのセットを生成し、そのため、第２のハイパーパラメータのセットが、ニューラルネットワークを使用してノイズ画像に適用されるとき、所定の閾値未満である誤差内の所望の画像の近似値を生成する、ステップと、第２のセットのハイパーパラメータを、将来の画像マッピング動作で使用するために記憶するステップと、を含む。

したがって、本発明者は、既知のノイズ画像を所望の画像にマッピングする関数として、ニューラルネットワークを利用し、画像の圧縮バージョン自体の代わりに関数のハイパーパラメータのみの転送を可能にする、損失画像およびビデオ圧縮のためのシステムおよび方法を構想し、実用化した。これは、受信システムが同じノイズ画像および同じまたは類似のニューラルネットワークを所有するという条件で、ハイパーパラメータを受信する任意のシステムによって所望の画像の高品質の近似値の再現を可能にする。所与の品質の画像を転送するために必要なデータ量は、既存の画像圧縮技術と対比して、劇的に削減される。ビデオは単に一連の画像であるため、この画像圧縮システムおよび方法の出願は、同じ画像品質に関して既存技術よりも大きな速度で画像コンテンツを転送することを可能にし、ビデオ圧縮においてもなお、すぐに最先端を超えることができることが期待される。本発明の以下の非限定的な概要は、明確にするために提供されており、以下の詳細な説明において記載される実施形態と一貫して解釈されるべきである。

好ましい実施形態によれば、ニューラルネットワークを利用する損失画像およびビデオ圧縮ならびに伝送のためのシステムであって、第１のプロセッサと、第１のメモリと、第１のメモリに記憶された第１の複数のプログラミング命令と、を含む、画像圧縮エンジンを含み、第１の複数のプログラミング命令が、第１のプロセッサ上で動作するときに、第１のプロセッサに、所望の画像を受信することと、ノイズ画像を回収することと、ハイパーパラメータを求めるために、第１のニューラルネットワークを使用して既知のノイズ画像を所望の画像にマッピングさせることであって、ハイパーパラメータが、第１のニューラルネットワークを使用してノイズ画像に適用されるとき、所定の閾値未満である誤差内で所望の画像の近似値を生成するように、マッピングすることと、ハイパーパラメータを伝送することと、を行わせ、第２のプロセッサと、第２のメモリと、メモリに記憶された第２の複数のプログラミング命令と、を含む、画像復元エンジンを含み、第２の複数のプログラミング命令が、第２のプロセッサ上で動作するときに、第２のプロセッサに、ハイパーパラメータを受信することと、ノイズ画像を回収することと、所定の閾値未満である誤差内で所望の画像の近似値を生成するために、第２のニューラルネットワークを使用してノイズ画像にハイパーパラメータを適用することと、を行わせる、システムが、開示されている。

別の好ましい実施形態によれば、ニューラルネットワークを利用する損失画像および伝送のための方法であって、第１のコンピューティングデバイスにおいて、所望の画像を受信するステップと、第１のコンピューティングデバイスを使用して、ノイズ画像を回収するステップと、第１のニューラルネットワークを使用してハイパーパラメータを求めるために、第１のコンピューティングデバイスを使用して、ノイズ画像を所望の画像にマッピングし、そのため、ハイパーパラメータが、第１のニューラルネットワークを使用してノイズ画像に適用されるとき、所定の閾値未満である誤差内で所望の画像の近似値を生成する、ステップと、ハイパーパラメータを第２のコンピューティングデバイスに伝送するステップと、第２のコンピューティングデバイスにおいて、ハイパーパラメータを受信するステップと、第２のコンピューティングデバイスにおいて、ノイズ画像を回収するステップと、第２のニューラルネットワークを使用して所定の閾値未満である誤差内で所望の画像の近似値を生成するために、第２のコンピューティングデバイスを使用して、ノイズ画像にハイパーパラメータを適用ステップと、を含む、方法が、開示されている。

実施形態の態様によれば、画像圧縮エンジンは、第１のニューラルネットワークの動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む。

実施形態の態様によれば、画像復元エンジンは、第２のニューラルネットワークの動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む。

添付の図面は、様々な態様を図示し、記載とともに、態様によった本発明の原理を説明する役割を果たす。図面に図示される特定の配設は、単なる例示であり、本発明の範囲または本明細書の特許請求の範囲をいかなる方式でも限定するものと見なされるべきではないことが、当業者によって理解されるであろう。

（先行技術）ＨＶＥＣビデオ圧縮および類似のＢＰＧ画像圧縮方法論を図示または要約する方法図である。実施形態による、本開示の発明について使用される関数を図示する、圧縮段階から復元段階までのオブジェクトの流れを図示する図である。代替的に、図２は、好ましい実施形態の態様の実装形態のための例示的なアルゴリズムを図示し得る。好ましい実施形態による、非一般的なニューラルネットワークを利用する損失画像圧縮のためのシステムの動作において使用される高水準コンポーネントのシステム図である。代替的に、図３は、好ましい実施形態による、例示的な全体的なシステム図を示し得る。態様による、画像圧縮エンジンの（例えば、例示的な）システム図である。好ましい態様による、または実施形態による、２Ｄ畳み込み特定用途向け集積回路（「ＡＳＩＣ）を利用する、画像圧縮エンジン（例えば、それが画像圧縮のために利用される場合）の（例えば、別の例示的な実施形態の）システム図である。態様による、システムを通じたデータの処理および圧縮を図示するフローチャートである。態様による、システムを介したデータの処理および復元を図示するフローチャートである。好ましい実施形態による、非一般的なニューラルネットワークを利用する損失画像圧縮のためのシステムの動作において使用される高水準コンポーネントの方法図である。好ましい態様による、開示された圧縮システムを使用して、画像を１人が符号化し、１人が復号化する、２人のユーザの状態図である。好ましい実施形態による、画像圧縮への非一般的なアプローチにおける結果から、学習する複数の画像とは対照的に、単一の画像を有するニューラルネットワークを訓練することを図示する方法図である。画像圧縮エンジンに入り、静止画像（またはノイズ画像）が初期非静止画像（または初期非ノイズ画像）にほぼ変換されることを可能にするパラメータが識別されて、静止画像（またはノイズ画像）から元の画像の近似値を再生成するために、ネットワークを越えて第２のシステムに中継される、線画画像および静止画像（またはノイズ画像）を図示する図である。好ましい態様による、画像を復元するために使用される画像圧縮エンジンのシステム図である。代替的に、図１２は、実施形態による、画像を復元するために使用される画像復元エンジンのシステム図を示し得る。特化された２Ｄ畳み込み特定用途向け集積回路（「ＡＳＩＣ」）を利用する画像圧縮エンジンのシステム図である。代替的に、図１３は、特化された２Ｄ畳み込み特定用途向け集積回路（「ＡＳＩＣ」）を利用する画像復元エンジンのシステム図を示し得る。好ましい実施形態による、画像またはビデオ圧縮、および復元を達成するためにメタネットワークを使用するシステムの動作において使用される高水準コンポーネントのシステム図である。好ましい実施形態による、訓練画像のセットでメタネットワークを訓練するために使用され、ノイズ画像を入力画像の近似値に変換するために使用され得るフィルタを圧縮して求めるために使用される、メタネットワークエンジンのシステム図である。実施形態による、特定のニューラルネットワーク構成を利用するシステムへの復元のためのデータを訓練、圧縮、および送信するためにメタネットワークを利用する損失圧縮のためのシステムのデータフロー図である。実施形態による、ノイズ画像に適用される畳み込みフィルタのシーケンスを生成し、画像を入力画像の近似値に漸進的に変換するために、メタネットワーク内で互いに通信する多数の個々のネットワークのシステム図である。メタネットワークを使用する画像およびビデオの損失圧縮のために必要なステップを図示する方法図である。実施形態による、画像符号化ネットワークｆのニューラルネットワークハイパーパラメータ予測のために、メタネットワーク内の単一のネットワークが画像のセットを訓練し、関数ｇの一部として動作するネットワークを生成するために実行するステップのフローチャートである。実施形態による、消失勾配問題を緩和するのに役立つ、静止画像を変換するための漸進的フィルタをクロス訓練および発展する目的のためにメタネットワーク内で通信する多数のネットワークのプロセスのフローチャートである。コンピューティングデバイスの例示的なハードウェアアーキテクチャを図示するブロック図である。クライアントデバイスのための例示的な論理アーキテクチャを図示するブロック図である。クライアント、サーバ、および外部サービスの例示的なアーキテクチャ配設を示すブロック図である。コンピューティングデバイスの例示的なハードウェアアーキテクチャを図示する別のブロック図である。

本発明者は、メタネットワークを利用する損失画像およびビデオ圧縮のためのシステムならびに方法を構想し、実用化した。

また、本発明者は、所望の画像を既知のノイズ画像にマッピングする関数として、ニューラルネットワークを利用し、画像の圧縮バージョン自体の代わりに関数のハイパーパラメータのみの転送を可能にする、損失画像およびビデオ圧縮のためのシステムおよび方法を構想し、実用化した。これは、受信システムが同じノイズ画像および類似のニューラルネットワークを所有するという条件で、ハイパーパラメータを受信する任意のシステムによって所望の画像の高品質の近似値の再現を可能にする。所与の品質の画像を転送するために必要なデータ量は、既存の画像圧縮技術と対比して、劇的に削減される。ビデオは単に一連の画像であるため、この画像圧縮システムおよび方法の出願は、単一の画像の場合と同様にビデオに対しても同様に働き、同じ画像品質に関して既存の技術よりも大きな速度でビデオコンテンツの転送をやがて可能にし得る。

１つ以上の異なる態様が、本出願において記載され得る。さらに、本明細書に記載される態様の１つ以上について、多数の代替的配設が記載され得、これらは、例示的な目的のみのために提示され、本明細書に包含される態様または本明細書に提示される特許請求の範囲をいかなる方式でも限定するものではないことを理解されたい。１つ以上の配設は、本開示から容易に明らかであり得るように、多数の態様に広く適用可能であり得る。概して、配設は、当業者が１つ以上の態様を実践することを可能にするのに十分な詳細が記載されており、他の配設が利用され得、構造的、論理的、ソフトウェア的、電気的、および他の変更が特定の態様の範囲から逸脱することなく行われ得ることを理解されたい。本明細書に記載される態様のうちの１つ以上の特定の特徴は、本開示の一部を形成し、例示として、態様のうちの１つ以上の具体的な配設を示す１つ以上の特定の態様または図面を参照して記載され得る。しかしながら、このような特徴は、それらが参照して記載される１つ以上の特定の態様または図面における使用に限定されないことを理解されたい。本開示は、態様の１つ以上の全ての配設の文字通りの記載でも、全ての配設に存在しなければならない態様の１つ以上の特徴の一覧でもない。

本特許出願において提供されるセクションの見出しおよび本特許出願の名称は、便宜上のものに過ぎず、いかなる方式においても本開示を制限するものとはみなされない。

他に明示的に指定されていない限り、互いに通信しているデバイスは、互いに連続して通信している必要はない。加えて、互いに通信しているデバイスは、論理的または物理的な１つ以上の通信手段または仲介役を介して直接的または間接的に通信し得る。

互いに通信している様々なコンポーネントを有する態様の記載は、このようなコンポーネントが全て必要であることを意味しない。それに反して、多種多様な任意選択的なコンポーネントは、多種多様な可能な態様を例示し、１つ以上の態様をより完全に例示するために記載され得る。同様に、プロセスステップ、方法ステップ、アルゴリズムなどは、連続した順序で記載され得るが、このようなプロセス、方法、およびアルゴリズムは、特に反対に述べられない限り、概して、代替の順序で働くように構成され得る。換言すれば、本特許出願に記載され得るステップの任意のシーケンスまたは順序は、それ自体が、ステップがその順序で実行されるという要件を示していない。記載されたプロセスのステップは、任意の実用的な順序で実行され得る。さらに、いくつかのステップは、同時に発生しないと記載または暗示されているにもかかわらず（例えば、１つのステップが他のステップの後に記述されているため）、同時に実行され得る。さらに、図面におけるその描写によるプロセスの図示は、図示されたプロセスが他の変形例およびその修正例を除外していることを意味するものではなく、図示されたプロセスまたはそのステップのいずれかが態様の１つ以上に必要であることを意味するものではなく、図示されたプロセスが好ましいことを意味するものではない。また、ステップは、概して、態様ごとに１回記載されるが、これは、それらが１回発生しなければならないことを意味するものではなく、プロセス、方法、またはアルゴリズムが実行（ｃａｒｒｙｏｕｔ）または実行（ｅｘｅｃｕｔｅ）されるたびに１回のみ発生し得ることを意味するものではない。いくつかのステップは、いくつかの態様またはいくつかの生起において省略され得、またはいくつかのステップは、所与の態様または発生において複数回実行され得る。

単一のデバイスまたは物品が本明細書において記載されるときに、単一のデバイスまたは物品の代わりに、１つより多くのデバイスまたは物品が使用され得ることは、容易に明らかになるであろう。同様に、１つより多くのデバイスまたは物品が本明細書において記載される場合、１つより多くのデバイスまたは物品の代わりに、単一のデバイスまたは物品が使用され得ることは、容易に明らかであろう。

デバイスの機能性または特徴は、代替的に、このような機能性または特徴を有すると明示的に記載されていない、１つ以上の他のデバイスによって具現化され得る。したがって、他の態様は、デバイス自体を含む必要はない。

本明細書に記載または参照される技術および機構は、明確にするために単数形で記載され得る。しかしながら、特定の態様は、別段の定めのない限り、技術の多数の反復または機構の多数のインスタンス化を含み得ることを理解されたい。図におけるプロセス記載またはブロックは、プロセスにおける具体的な論理機能またはステップを実装するための１つ以上の実行可能命令を含むモジュール、セグメント、またはコードの一部を表すものとして理解されるべきである。代替の実装形態は、例えば、機能が、当業者に理解されるように、関与する機能性に応じて、実質的に同時にまたは逆の順序を含む、示されまたは考察されたものから順番に実行され得る様々な態様の範囲内に含まれる。

定義
本明細書で使用される場合、「人工知能」または「ＡＩ」は、学習、問題解決、および意思決定などの人間の知能と関連付けられる認知機能のいくつかの態様または（複数の）態様を模倣するようにプログラムされたコンピュータシステムまたはコンポーネントを意味する。現在のＡＩテクノロジーの例は、人間の音声の理解、チェスおよびＧｏ（碁）などの戦略的なゲームでの競争、車両の自律運転、複雑なシミュレーション、画像およびビデオなどの複雑なデータの解釈などを含む。

本明細書で使用される場合、「関数」、「画像変換関数」、「画像変換ネットワーク」、および「画像変換ニューラルネットワーク」は、画像を変換する、または画像の近似値を再作成するための関数としてのニューラルネットワークの使用を意味する。変換は、ノイズ画像（例えば、入力ノイズ画像）をターゲット画像にマッピングすること、およびハイパーパラメータとも称され得る関数内の様々な変数の重みの調整に基づいている。ハイパーパラメータはまた、画像の近似値を再作成するために、ノイズ画像とともに関数への入力として使用され得る。

本明細書で使用される場合、ハイパーパラメータは、指定された誤差範囲内でノイズ画像をターゲット画像（または、所望の画像）にマッピングする関数のパラメータを意味する。画像がソース位置においてマッピングのための関数に入力するとき、ハイパーパラメータは、出力される。次いで、ハイパーパラメータは、宛先位置に転送され得、ここで、ハイパーパラメータは、同じノイズ画像を有する同じ（または類似の）関数への入力となり、関数の出力は、宛先位置における所望の画像の近似値となる。（例において、機能的符号化用語（本明細書の例において使用される）で使用される「ハイパーパラメータ」という用語は、機械学習用語において使用される「重み」または「重みパラメータ」という用語に相当することに留意されたい）。

本明細書で使用される場合、「目標画像」は、「ターゲット画像」または「所望の画像」または「画像」とも互換的に称され、画像のデジタル表現を意味する。このデジタル表現は、既に多数存在する任意の画像ファイルフォーマットであり得る。画像ファイルは、一般的に、ラスターベースのフォーマット（すなわち、画素のコンテンツまたは画像のエリアが指定されるフォーマット）またはベクターベース（すなわち、具体的な画素、エリア、または画像サイズに関係なく、形状およびそれらの関係が指定されるフォーマット）のいずれかとして分類される。例示的な目的のために、ラスターベースのフォーマットの非網羅的および非限定的なリストは、ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓのビットマップ（ｂｍｐ）と、ＣｏｍｐｕＳｅｒｖｅのＧｒａｐｈｉｃｓＩｎｔｅｒｃｈａｎｇｅＦｏｒｍａｔ（ｇｉｆ）と、ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔｓＧｒｏｕｐのＪＦＩＦフォーマット（ｊｐｇまたはｊｐｅｇ）と、ＰｏｒｔａｂｌｅＧｒａｐｈｉｃｓＮｅｔｗｏｒｋ（ｐｎｇ）と、ＴａｇｇｅｄＩｍａｇｅＦｉｌｅＦｏｒｍａｔ（ｔｉｆまたはｔｉｆｆ）と、を含む。例示的な目的のために、ベクターベースのフォーマットの非網羅的および非限定的なリストは、ＡｄｏｂｅＩｌｌｕｓｔｒａｔｏｒＦｉｌｅ（ａｉ）と、ＣｏｒｅｌＤＲＡＷＩｍａｇｅＦｉｌｅ（ｃｄｒ）と、ＳｃａｌａｂｌｅＶｅｃｔｏｒＧｒａｐｈｉｃｓＦｉｌｅ（ｓｖｇ）と、ＭｉｃｒｏｓｏｆｔＶｉｓｉｏＤｒａｗｉｎｇＦｉｌｅ（ｖｓｄ）と、を含む。

本明細書で使用される場合、「画像変換」は、任意の画像、または空白もしくは「空の」画像ファイルを任意の他の画像に変換することの行為を意味する。これは、具体的な画素の変更、数学的方程式に基づくベクトルグラフィックスの使用（例えば、画像自体が所与の解像度で具体的な画素によって表されるのではなく、方程式で指定されるため、画像自体のズームに関係なく完璧な解像度をもたらす方程式で曲線をグラフ化すること）、または境界検出および変更のためなどの画素のグループを調べて変更することを含む任意の組み合わせにおける多数の異なる技術によって行われ得る。画像中のデータの画素の位置を変更するが、それ以外の場合、例えば、画像を回転させるなど、データを変更しないようにすることは、画像変換の別の例である。

本明細書で使用される場合、「機械学習」は、コンピュータシステムまたはコンポーネントが、その動作または理解を明示的にプログラムされることなく修正することができる、人工知能の態様である。機械学習アルゴリズムは、訓練セットとしてそれらに送られた情報に基づいて行動または理解のモデルを発展し、新しい受信情報に基づいてそれらのモデルを修正することができる。機械学習アルゴリズムの例は、Ｇｏ（碁）のゲームで人間の世界チャンピオンを打ち負かした最初のコンピュータプログラムであるＡｌｐｈａＧｏである。ＡｌｐｈａＧｏは、Ｇｏ（碁）をプレイするように明示的にプログラミングされていなかった。それは、何百万ものＧｏ（碁）のゲームが与えられ、ゲームおよびプレイの戦略の独自のモデルが発展された。

本明細書で使用される場合、「ニューラルネットワーク」は、外部入力に対するそれらの動的状態応答によって情報を処理する、いくつかの単純で高度に相互接続された処理要素から構成される計算モデル、アーキテクチャ、またはシステムを意味し、したがって、パターンまたは傾向を認識することによって情報を「学習」することができる。「人工ニューラルネットワーク」としても知られることがあるニューラルネットワークは、哺乳類の脳などの生物学的ニューラルネットワークの構造および機能の私たちの理解に基づいている。ニューラルネットワークは、機械学習アルゴリズムの適用のための枠組みである。

本明細書で使用される場合、「静止画像」または「ノイズ画像」とも称される「静止ノイズ画像」は、ランダムまたは疑似ランダムコンテンツを有する画像を意味する。いくつかの実施形態において、ランダムまたは疑似ランダムコンテンツは、画素レベルであるか、または画素のグループ、エリア、または領域のレベルである。いくつかの実施形態において、ランダムまたは疑似ランダムコンテンツは、その画素について黒または白のいずれかを表す画素ごとの単一ビットを含み得る。いくつかの実施形態において、画像のランダム性特性は、その特性の一部として、２Ｄ最大情報エントロピー、またはＳｈａｎｎｏｎＥｎｔｒｏｐｙであり得る。ＳｈａｎｎｏｎＥｎｔｒｏｐｙは、所与の統計モデルが有することができる、ランダム性または可能な情報の量をビットで表すことを指す。例えば、単一のコインフリップが、１ビットで表される０（裏（ｔａｉｌｓ））または１（表（ｈｅａｄｓ））の値を有するので、（１回の）コインフリップは、１の情報エントロピーまたはＳｈａｎｎｏｎＥｎｔｒｏｐｙを有する一方、ｍ回のコインフリップは、ｍのエントロピー値を有する。所与のオブジェクトのエントロピー値が高いほど、その状態を予測することは困難になり得る、可能性のある状態が多くなるが、多くの可能性のある状態に変換して、別の状態の推定値、例えば、別の画像の近似値に変換することを獲得するための可鍛性が高くなる。いくつかの実施形態において、ランダムまたは疑似ランダムコンテンツは、グレースケールまたは色情報をさらに含み得る。いくつかの実施形態において、ランダムまたは疑似ランダムコンテンツは、ビットマップまたは画素の代わりに、ベクトルグラフィックスまたは画像表現の他の形式を含み得る。

本明細書で使用される場合、「ビデオ」は、動きを表す画像のシーケンスのデジタル表現を意味する。このデジタル表現は、既に多数存在する任意のビデオファイルフォーマットであり得る。ビデオファイルは、典型的には、「コンテナ」にコード化されたビデオ（可視）データおよびオーディオ（可聴）データを包含する。この出願は、主にビデオファイルのビデオデータ部分に関連している。例示的な目的のために、ビデオフォーマットの非網羅的および非限定的なリストは、ＡｕｄｉｏＶｉｄｅｏＩｎｔｅｒｌｅａｖｅ（ａｖｉ）と、ＭｏｔｉｏｎＰｉｃｔｕｒｅｓＥｘｐｅｒｔＧｒｏｕｐ（ｍｐｇ、ｍｐｅｇ、ｍｐ２、ｍｐ４など）と、Ａｐｐｌｅのビデオフォーマット（ｍ４ｖ）と、ＷｉｎｄｏｗｓＭｅｄｉａＶｉｄｅｏ（ｗｍｖ）と、を含む。

概念的アーキテクチャ
図１（先行技術）は、ＨＥＶＣビデオ圧縮および類似のＢＰＧ画像圧縮方法論を図示または要約する方法図である。まず、画像またはビデオファイルは、データファイルが、ＨＥＶＣビデオファイル圧縮の場合、ビデオのフレームを通じて変化しないままのフレーム内チャンクで符号化される（１２０）前に、圧縮コーデックまたは圧縮エンジンに入力され（１１０）、これは、画素のグループ化が変化しない、または変化が非常に少ないビデオのフレーム間で、そのグループ化がビデオの多数のフレームで再符号化されない（１３０）ことを意味し、それによって、フレーム内のわずかな動きの損失のみでビデオのサイズを小さくする。ＨＥＶＣビデオフォーマットのためのビデオではなく静止画像のためのＢＰＧフォーマットの場合において、静止画像（１３０）内の画素群について色深度を含む類似のデータのクラスタが維持され、等しいサイズの画像に必要とされるデータの減少を表し、ビデオおよび静止画像の両方について類似の技術を使用して圧縮されたフォーマットとなる（１４０）。

図２は、好ましい実施形態の態様の実装形態のための例示的なアルゴリズムを図示する図である。このアルゴリズムにおいて、所望の画像２０１およびノイズ画像２０３は、関数ｆ２０２に入力される。関数ｆ２０２は、ノイズ画像２０３を所望の画像２０１にマッピングするように構成されたニューラルネットワークである。関数ｆ２０２の出力は、指定された誤差範囲内で、ノイズ画像２０２を所望のまたはターゲット画像２０１にマッピングするハイパーパラメータＰ２０４、または、関数ｆ２０２の「重み」のセットである。このアルゴリズムについての数式は、

Ｉ、Ｎ、εが与えられると、以下のようにしてθを求める。

式中、ｆ（θ｜Ｎ）：＝Ｉ’とｈ（Ｉ’，Ｉ）≦ε

アルゴリズムは、概して、以下のように記載され得る。幅Ｗ_Ｉ、高さＨ_Ｉ、および深さＣ_Ｉを有するカラー画像Ｉ（ターゲットまたは所望の画像２０１に対応する）が与えられると、既知の関数ｆ２０２のハイパーパラメータθを微調整することによって、サイズＷ_Ｎ×Ｈ_Ｎ×Ｃ_Ｎの与えられた最大エントロピー画像ＮとＩとの間のマッピングを求め得るアルゴリズム２２０が存在する。しかしながら、このようなアルゴリズムは、元の画像の近似値を再構築することのみが可能であり、定義された閾値εまでの誤差を許容する。アルゴリズム２２０は、画素単位の平均二乗誤差関数などの、様々な可能な画像比較関数のうちの１つであり得る関数ｈを通じて、２つの画像間の誤差を測定する。全ての画像Ｉについて、上記のステートメントが真であるようにθ_ｆを有するｆ２０２が存在する場合、｛ｆ、θ_ｆ、Ｎ｝の３ビットバイト（ｔｒｉｐｌｅｔ）を介して全ての画像をほぼ表すことが可能である。関数ｆ２０２が固定され、その入力Ｎの場合、Ｉ’を作成するために欠けているのは、θだけである。θのファイルサイズがＩのファイルサイズより小さい場合、アルゴリズムは、近似目標画像Ｉ’２０７を取得するために宛先／受信側のｆ２０５にノイズ画像２０６およびパラメータθ２０４を入力してことによって、宛先デバイスで３ビットバイト（ｔｒｉｐｌｅｔ）｛ｆ、θ、Ｎ｝からＩ’を作成するために、サイズファイルサイズ（θ）のビットストリームを有するθを送信する必要だけであるため、損失圧縮Ｉを正常に有する。

しかしながら、効率的にθを求める関数ｆをどのように選ぶかはすぐには明らかではない。解決策は、畳み込み→バイアス→非線形性→繰り返しの典型的な構造を有するニューラルネットワークを関数ｆとして使用することである。ニューラルネットワークを関数ｆとして使用することによって、Ｉが与えられた場合のハイパーパラメータθを求めるための解決策は、例えば、確率的勾配降下法（ＳＧＤ）を使用して解決することができる機械学習訓練問題になる。要するに、ＳＧＤは、誤差関数ｈを最小化するハイパーパラメータ（別名、重み）を学習するために使用されるので、Ｉについてθを取得している。

ハイパーパラメータθ２０４がニューラルネットワーク２０２から出力された後、それらは、所望の画像Ｉ２０７の近似値を生成するために、同一のノイズ画像２０６の別個のインスタンスとともに、同じまたは類似のニューラルネットワーク２０５の別個のインスタンスに入力され得る。このようにして、システムは、入力として受信されるものに応じて、ハイパーパラメータθ２０４または画像Ｉ２０７の近似値のいずれかに応じて、２つのオブジェクトのうちの１つを生成することによって、圧縮器および復元器として動作する。復元ニューラルネットワーク２０５および関連データなどのこれらのオブジェクトのインスタンスは、異なるコンピュータで動作し得、例えば、所望の画像Ｉ２０１、関数ｆ２０２、およびノイズ画像２０３を所有する第１のネットワークエンドポイントは、スマートフォン、ラップトップ、または他のコンピューティングデバイスなどの１つのコンピュータで動作し得る一方、別の関数ｆ２０５、ノイズ画像２０６は、ネットワークを越えて、可能であるが、必ずしもそうではない別のコンピューティングデバイス上に存在し得る。例えば、２つのコンピュータ間のネットワークを越えるのではなく、ポータブルメモリデバイスを介してファイルを転送されることが可能である。伝送のいずれかの端にあるニューラルネットワークの異なるインスタンスが同一である必要はないことに注意することが重要である。同様に機能するニューラルネットワークは、そのアーキテクチャ、プログラミング、または他の特性が異なる場合でも、許容可能な解決策を生成する。

図３は、好ましい実施形態による、例示的な全体的なシステム図である。ラップトップもしくはデスクトップコンピュータ、携帯電話、ワークステーション、またはネットワーク対応コンピューティングデバイスの何らかの他の様式であり得る、ネットワークエンドポイント３０１は、インターネットなどのネットワーク３０６を越えて接続され得、所望の画像Ｉ３０４およびノイズ画像Ｎ３０５を所有する。ネットワークエンドポイント３０１では、両方の画像は、ネットワークエンドポイント３０１によって直接アクセス可能な画像圧縮エンジン３０３の入力として使用され得る。所望の画像Ｉ３０４は、．ＪＰＧ／．ＪＰＥＧ、．ＰＮＧ、．ＢＭＰ、または他のフォーマットを含む多くの画像フォーマットのうちの１つであり得、その具体的なフォーマットは、適用される新しいフォーマットが識別され、将来説明され得るため、本発明にとって重要ではない要素である。静止ノイズ画像Ｎ３０５は、同様に、多くのフォーマットのうちの１つであり得、システムの全ての実装形態で使用される単数の変化しない画像であり得、またはいくつかの可能な画像のうちの１つであり得、ネットワークエンドポイント３０７もしくは画像を包含するいくつかの他のソースのいずれであっても、別のソースから入力としてシステムに送信され得る。いくつかの実施形態において、静止ノイズ画像Ｎ３０５は、必要に応じて他の画像への変換に使用され得る、最も高い２ＤＳｈａｎｎｏｎＥｎｔｒｏｐｙを有する画像を表す。画像圧縮エンジン３０３は、ネットワークエンドポイント３０１上に存在するエンジンであり、ネットワークエンドポイント３０１は、所望の画像Ｉ３０４と静止ノイズ画像Ｎ３０５を入力としてとり、画像変換関数２０２を実行して、ノイズ画像Ｎ３５０に適用されると、所望の画像Ｉ３０４の近似値Ｉ’（「Ｉ－プライム」と読み取られ、Ｉの近似値を示す）３１０の再現を可能にする関数２０２のためのハイパーパラメータを生成し得る。具体的には、宛先エンドポイント３０７は、静止ノイズ画像３１１を入力としても使用して、画像復元エンジン３０９の別のインスタンスに入力するためのハイパーパラメータ３０８を受信し得、それは、所望の画像Ｉ３０４の近似値３１０、Ｉ’を生成することを可能にする。

図４は、好ましい実施形態による、画像圧縮エンジン３０３の例示的なシステム図である。図３に示されるように、それぞれ最大エントロピーノイズ画像および圧縮されるべき初期画像を表すノイズ画像Ｎ３０５およびゴール画像Ｉ３０４は、プロセッサ４３０に入力される。プロセッサ４３０は、算術および論理演算を処理するために使用される一般的なコンピューティングデバイスであり、当該技術分野において一般的に知られている。プロセッサ４３０は、プロセッサ４３０によってアクセスされるデータの短期記憶のために、一般にランダムアクセスメモリ（「ＲＡＭ」）として知られる揮発性メモリ４４０の少なくとも単一ビットとの双方向通信を有し、プロセッサが、ＲＡＭ内のデータを変更し、独自のプロセスを変更するためにＲＡＭ内のデータを使用する。これは、現代のコンピューティングにおいて鍵となる相互作用の１つとして一般的に理解されている。プロセッサ４３０はまた、ノイズ画像３０５およびゴール画像３０４からの入力データを処理するために機械学習アルゴリズム４２０ための枠組みとして動作する、アルゴリズム２２０内の関数ｆとして動作する、ニューラルネットワーク４１０と通信する。図２のアルゴリズム２２０を使用して、入力画像３０４がほぼ再作成された後、ニューラルネットワーク４１０のハイパーパラメータ３０２は、宛先エンドポイントに伝送すること、ハードドライブもしくは外部メモリデバイスに保存すること、または圧縮画像のための他の一般的な使用を含む、さらなる使用のためにネットワークエンドポイント３０１に出力される。

図５は、実施形態による、２Ｄ畳み込み特定用途向け集積回路（「ＡＳＩＣ」）５６０を利用する、画像圧縮エンジン５００の別の例示的な実施形態のシステム図である。この実施形態において、２Ｄ畳み込みＡＳＩＣ５６０は、システムが画像を完全に圧縮するために必要な処理時間を削減するために、利用される。図３に示されるように、それぞれ最大エントロピーノイズ画像および圧縮されるべき初期画像を表すノイズ画像Ｎ３０５およびゴール画像Ｉ３０４は、プロセッサ５３０に入力される。プロセッサ５３０は、算術および論理演算を処理するために使用される一般的なコンピューティングデバイスであり、当該技術分野において一般的に知られている。プロセッサ５３０は、プロセッサ５３０によってアクセスされるデータの短期記憶のために、一般にランダムアクセスメモリ（「ＲＡＭ」）として知られる揮発性メモリ５４０の少なくとも単一ビットとの双方向通信を有し、プロセッサが、ＲＡＭ内のデータを変更し、独自のプロセスを変更するためにＲＡＭ内のデータを使用する。これは、現代のコンピューティングにおいて鍵となる相互作用の１つとして一般的に理解されている。２Ｄ畳み込みＡＳＩＣ５１１はまた、畳み込みニューラルネットワーク５１０データの特化された処理を他の方法で達成され得るよりもはるかに速く扱うために、システムプロセッサ５３０およびメモリ５４０の両方と双方向に通信する。プロセッサ５３０はまた、ノイズ画像３０５およびゴール画像３０４からの入力データを処理するために機械学習アルゴリズム５２０ための枠組みとして動作する、アルゴリズム２２０内の関数ｆとして動作する、ニューラルネットワーク５１０と通信する。図２のアルゴリズム２２０を使用して、入力画像３０４がほぼ再作成された後、ニューラルネットワーク５１０のハイパーパラメータ３０２は、宛先エンドポイントに伝送すること、ハードドライブもしくは外部メモリデバイスに保存すること、または圧縮画像のための他の一般的な使用を含む、さらなる使用のためにネットワークエンドポイント３０１に出力される。

図６は、態様による、システムを通じたデータの処理および圧縮を図示するフローチャートである。所望の画像Ｉは、システムに入力され得（６０１）、これは、システムがノイズ画像を特定のハイパーパラメータに変換しようと試みる画像である。システムが既に静止ノイズ画像３０５を所有するかどうかに関して、正または負の結果のいずれかをもたらし得る、ノイズ画像についてのチェックが、実行される（６０２）。システム内に現在存在する静止ノイズ画像が存在しない場合、ノイズ画像は、静止ノイズ画像を所有し得るネットワークエンドポイント３０７を通じてシステムに入力され得（６０３）、または自動的に生成され得、または何らかの他のソースから来る。静止ノイズ画像が既に存在する場合、または、それが受信された後、もしくはシステムに入力された（６０３）後、システムは、静止ノイズ画像Ｎ３０５および所望の画像Ｉ３０４の両方がシステム内に存在する状態にある。この時点で、静止ノイズ画像Ｎ３０５に適用するために画像変換関数ｆは、利用または実行され得（６０４）、変換の結果は、近接性が誤差値εによって定義された、所望の画像Ｉへの近接性についてチェックされ（６０５）、ニューラルネットワークのハイパーパラメータは、出力され（６０７）、およびシステムは、実行を終了し、新しい入力画像を受信して実行を再開するための（６０１）準備をする。ノイズ画像Ｎ３０５上で動作する画像変換関数ｆ４１０が、所望の画像Ｉ３０４に十分に近い結果をもたらさない場合、次いで、ニューラルネットワーク４１０は、出力が画像Ｉ３０４に十分に近くなるまで（６０５）、より近い結果を生成しようと試みるために、変換ニューラルネットワークｆ４１０の変更可能なハイパーパラメータθ３０２を変更し得る（６０６）。

図７は、態様による、システムを通じたデータの処理および圧縮を図示するフローチャートである。まず、ハイパーパラメータは、受信され、ノイズ画像の所望の画像への画像変換および畳み込みを決定するために、ニューラルネットワーク４１０に適用する、画像圧縮エンジンに入力する（７０１）。システムは、静止ノイズ画像Ｎが存在することを確認するためにチェックされ（７０２）、ノイズ画像が存在しない場合、このような画像は、変更可能なハイパーパラメータθと同じソースから送信され得、または別のシステムによって挿入され、もしくはシステム自体上のユーザによって手動で入力され得る、システムに入力される（７０３）。ノイズ画像Ｎがシステムに挿入された（７０３）後、またはノイズ画像が既に存在する場合、例えば、ノイズ画像が本開示の全ての実装形態にわたって静的であり、同一である場合、画像変換関数ｆが実行され得るが、図６のような入力ハイパーパラメータを有しない代わりに、ハイパーパラメータは既にシステムに入力され（７０１）、静止ノイズ画像３０５は、出力（７０５）の前に、所望の画像Ｉ３０４の近似値である画像Ｉ’に変換される（７０４）。このように、画像圧縮は、画像データ自体を変更するのではなく、画像をどのように再作成するかを指定し、画像自体を再作成するのではなく、画像を再作成する仕様を可能にし、データの優れた圧縮を確保することによって行われる。

図８は、好ましい実施形態による、ニューラルネットワークを利用する損失画像圧縮のためのシステムの動作において使用される高水準コンポーネントの方法図である。まず、所望の画像が存在するか、または入力していなければならない（８０１）、この画像は、静止ノイズ画像Ｎ３０５にアクセスされる（８０２）前に、画像変換ネットワーク４１０で再作成されるように試みられる画像である。このノイズ画像は、変更可能なハイパーパラメータを使用して、それを所望の入力画像Ｉ３０４の近似値に変換することを試みるために、画像変換関数４１０によって利用される。ノイズ画像が静的であり、変化しない場合３０４に、受信またはアクセスされた後、画像変換関数ｆ４１０は、実行され（８０３）、変更可能なハイパーパラメータθ３０２を利用し、ニューラルネットワーク２６０上で動作する機械学習アルゴリズム２５０のセットに供給され、結果として、入力画像Ｉ３０４により近い近似値を変換しようとする試みにおいて、画像変換関数ｆについての変更可能なハイパーパラメータθが変更される（８０４）、（８０５）。画像がノイズ画像Ｎ３０５の変換から生成されるとき、変更可能なハイパーパラメータθ３０２は、画像変換関数４１０、ノイズ画像３０５、およびハイパーパラメータ３０２を有するユーザが元の所望の画像３０４の近似値を再作成し得るように、出力する（８０６）。このようにして、画像は、大きく圧縮され、画像変換関数自体にアクセスすることなく、ユーザから潜在的に暗号化され得る。次いで、変更可能なハイパーパラメータθ３０２は、別のラップトップ、デスクトップ、もしくはワークステーションデバイス、または図５に指定されるように２Ｄ畳み込みＡＳＩＣを実行することの可能な他のデバイスなど、別のネットワークエンドポイント３０７、に送信され得る（８０７）。次いで、宛先ネットワークエンドポイント３０７は、変更可能なハイパーパラメータθ３０２を使用して、画像変換関数ｆを実行し得（８０８）、ニューラルネットワーク４１０がノイズ画像３０５を所望の画像Ｉ３０４の近似値に変換するパラメータとして（８１０）、変更可能なハイパーパラメータθを入力する（８０９）。

図９は、開示された圧縮システムを使用して、画像を１人が符号化し、１人が復号化する、２人のユーザの状態図である。第１の状態９１０において、ユーザＡは、所望の画像Ｉ３０４を有する一方、ユーザＢは、画像Ｉ３０４を受信することを欲するが、それをまだ所有していない。これは、ファイルが最初に圧縮されることを多くの考えられる理由の１つを必要とする別のユーザ、おそらくは友人、同僚、またはサードパーティサービスに圧縮および送信するための画像を所有するユーザに類似する。第１の状態から必然的に続く第２の状態９２０において、訓練は、ハイパーパラメータθ３０２を調整して、画像変換関数が静止ノイズ画像Ｎ３０５を所望の画像Ｉ３０４の近似値に変換することを可能にするニューラルネットワーク４１０を用いて行われる。第２の状態から続く第３の状態９３０は、ユーザＡが第４の状態９４０に進む前に、訓練から従前に記述されたようにパラメータθ３０２を獲得することを可能にし、第４の状態９４０では、ハイパーパラメータθ３０２がユーザＡからユーザＢに伝送され、第５の状態が９５０に到達することを可能にし、それによって、ハイパーパラメータθ３０２を所有するユーザＢは、画像変換関数ｆ４１０を利用してノイズ画像Ｎ３０５を所望の画像Ｉ３０４の近似値に変換することによって、Ｉ３０４を獲得し得る。

図１０は、画像圧縮への非一般的なアプローチにおける結果から、学習する複数の画像とは対照的に、単一の画像を有するニューラルネットワークを訓練することを図示する方法図である。所望の画像は、開示されたシステムにおいて従前に詳述されたように、システムに入力され（１０１０）、このような画像は、．ＢＭＰ、．ＰＮＧ、または他のものを含む多数の実行可能なフォーマットのうちの１つの任意の２次元グラフィカルファイルを含む。ニューラルネットワーク４１０は、画像３０５を変更またはスワップアウトすることなく、静止ノイズ画像Ｎ３０５上で使用して訓練され（１０２０）、一般化されたニューラルネットワークとは異なり、大きなデータセットではなく単一のデータポイント上で訓練されるネットワークを結果としてもたらす。大規模データセットをネットワークに供給するのではなく、ネットワークの枝重み（ｅｄｇｅｗｅｉｇｈｔｓ）は、ネットワークの画像変換の所与の出力が所望の画像Ｉ３０４にどの程度近づいたかに基づいて調整される（１０３０）。このようにして、訓練は、調整された重みおよびパラメータを使用して、単一のノイズ画像３０５上のネットワーク４１０上で継続される（１０４０）。表１０５０は、単一のノイズ画像上で繰り返し訓練することによって、問題の一般化された解決策に到達する従来のニューラルネットワークと、特化された訓練方法を利用し、一般的な画像変換技術を学習しない提案されるニューラルネットワーク４１０との間の差異および関係を図示し、ネットワークの重みおよびパラメータを、所望の画像への近似値が生成されるまで、新しい変換された画像を生成するように変更する。

図１１は、画像圧縮エンジンに入り、ノイズ画像が初期非ノイズ画像にほぼ変換されることを可能にするパラメータが識別されて、ノイズ画像から元の画像の近似値を再生成するために、ネットワークを越えて第２のシステムに中継される、実際の画像およびノイズ画像を図示する図である。サンプル画像１１０１および静止ノイズ画像１１０２は、画像圧縮エンジン３０３に入力される。画像１１０１を再作成するためのハイパーパラメータ３０３は、ノイズ画像１１０２を所望の画像１１０１の近似値に変換するためのニューラルネットワークの訓練を通じて案出され、ノイズ画像１１０２が正しい変換ステップで任意の数の画像に変換可能な最大エントロピー画像であることにより変換が可能である。画像１１０１を再作成するためのハイパーパラメータ３０２は、ネットワーク３０６を越えて送信され、静止ノイズ画像１１０２のコピー１１０３とともに画像復元エンジン３０９に送られ、所望の画像１１０１の近似値１１０４を出力する。なお、これは、同一のコピーではなく、近似値であるため、損失圧縮方法を図示し、元の画像１１０１と同一ではない別の画像ファイル１１０４を作成する。

図１２は、実施形態による、画像を復元するために使用される画像復元エンジン１２００のシステム図である。画像復元エンジン１２００は、画像圧縮エンジン３０３と同じコンポーネントを使用するが、ノイズ画像３０５およびハイパーパラメータ３０２を（例えば、プロセッサ１２３０を介して）受信し、近似画像Ｉ’３１０を出力するように構成されていることに留意されたい。図１２の右手部分に示されているように、ノイズ画像Ｎ３０５、およびニューラルネットワーク１２１０の変更可能なハイパーパラメータ３０２は、プロセッサ１２３０に入力される。プロセッサ１２３０は、算術および論理演算を処理するために使用される一般的なコンピューティングデバイスであり、当該技術分野において一般的に知られている。プロセッサ１２３０は、プロセッサ１２３０によってアクセスされるデータの短期記憶のために、一般にランダムアクセスメモリ（「ＲＡＭ」）として知られる揮発性メモリ１２４０の少なくとも単一ビットとの双方向通信を有し、プロセッサが、ＲＡＭ内のデータを変更し、その独自のプロセスを変更するためにＲＡＭ内のデータを使用する。これは、現代のコンピューティングにおいて鍵となる相互作用の１つとして一般的に理解されている。プロセッサ１２３０はまた、ノイズ画像３０５、および、復元の目的のために、従前のニューラルネットワークのゴール画像３０４の圧縮のハイパーパラメータθ３０２からの入力データを処理するために機械学習アルゴリズム１２２０のための枠組みとして動作する、アルゴリズム２２０内の関数ｆとして動作する、ニューラルネットワーク１２１０と通信する。ハイパーパラメータθ３０２がプロセッサ１２３０に入力された後、プロセッサは、これらのハイパーパラメータを組み込んで使用するようにニューラルネットワーク１２１０に指示し、図２のアルゴリズム２２０を使用して、ノイズ画像３０５を入力画像３０４の近似値３１０に変換するときにネットワークの動作を指示し、近似画像Ｉ’３１０は、宛先エンドポイントに伝送すること、ハードドライブまたは外部メモリデバイス上に保存すること、または現在の非圧縮画像のための他の一般的な使用を含む、さらなる使用のためにネットワークエンドポイント３０７に出力される。

図１３は、実施形態による、特化された２Ｄ畳み込み特定用途向け集積回路（「ＡＳＩＣ」）１３１１を利用する一方、復元のために使用される画像復元エンジン１３１０の配設の代替的な実施形態のシステム図である。画像復元エンジン１３００は、画像圧縮エンジン３０９と同じコンポーネントを使用するが、ノイズ画像３０５およびハイパーパラメータ３０２を受信し、近似画像Ｉ’３１０を出力するように構成されていることに留意されたい。図３の右手部分に示されているように、ノイズ画像Ｎ３０５、およびニューラルネットワーク１３１０の変更可能なハイパーパラメータ３０２は、プロセッサ１３３０に入力される。プロセッサ１３３０は、算術および論理演算を処理するために使用される一般的なコンピューティングデバイスであり、当該技術分野において一般的に知られている。プロセッサ１３３０は、プロセッサ１３３０によってアクセスされるデータの短期記憶のために、一般にランダムアクセスメモリ（「ＲＡＭ」）として知られる揮発性メモリ１３４０の少なくとも単一ビットとの双方向通信を有し、プロセッサが、ＲＡＭ内のデータを変更し、その独自のプロセスを変更するためにＲＡＭ内のデータを使用する。これは、現代のコンピューティングにおいて鍵となる相互作用の１つとして一般的に理解されている。２Ｄ畳み込みＡＳＩＣ１３１１はまた、畳み込みニューラルネットワーク１３１０データの特化された処理を他の方法で達成され得るよりもはるかに速く扱うために、システムプロセッサ１３３０およびメモリ１３４０の両方と双方向に通信する。プロセッサ１３３０はまた、ノイズ画像３０５、および、復元の目的のために、従前のニューラルネットワークのゴール画像３０４の圧縮のハイパーパラメータθ３０２からの入力データを処理するために機械学習アルゴリズム１３２０のための枠組みとして動作する、アルゴリズム２２０内の関数ｆとして動作する、ニューラルネットワーク１３１０と通信する。ハイパーパラメータθ３０２がプロセッサ１３３０に入力された後、プロセッサは、これらのハイパーパラメータを組み込んで使用するようにニューラルネットワーク１３１０に指示し、図２のアルゴリズム２２０を使用して、ノイズ画像３０５を入力画像３０４の近似値３１０に変換するときにネットワークの動作を指示し、近似画像Ｉ’３１０は、宛先エンドポイントに伝送すること、ハードドライブまたは外部メモリデバイス上に保存すること、または現在の非圧縮画像のための他の一般的な使用を含む、さらなる使用のためにネットワークエンドポイント３０７に出力される。

既知のノイズ画像を所望の画像に効果的にマッピングするために単一のニューラルネットワークを訓練することは、（例えば、最急勾配降下）に基づく通常の訓練方法を使用して、圧縮される所望の各画像について達成するために、典型的には、高度に最適化されたグラフィカルプロセッシングユニット（ＧＰＵ）ベースの機械が何時間もかかるため、所与の所望の画像についてｆの重みを効率的に決定するための異なる方法を求めることが重要である。ある態様によれば、本発明者らは、恣意的精度（ＦにＮを適用することによって得られる出力画像が、ｆのそれぞれの重みを生成するために使用される入力画像とどれだけ密接に一致するかという意味で）により、ｆについての重みを、以下に記載されるメタネットワークを通る単一のパスで生成することが可能であると決定した。具体的には、所望の画像Ｉおよび既知のノイズ画像Ｎをメタネットワークを用いて関数ｇへ入力として渡すことによって、ｆに対する重みは、図１４～１７を参照して以下に記載されるように、１回のパスで取得される。より正確には、本発明者らは、図１７に示されるように配設されたメタネットワークが、画像の実行時間圧縮に関して大幅に増加した符号化効率を論証したことを示している。具体的には、ハイエンドＧＰＵでのＳＧＤを介した訓練は、６時間より多くかかった。それとは対照的に、ｇの実行時間は、類似のハードウェアでは１秒未満であり、特化されたハードウェア（ハードウェアベースの最適化された畳み込み段階など）であれば、１００ミリ秒未満であり得る。

図１４は、好ましい実施形態による、画像またはビデオ圧縮、および復元を達成するためにメタネットワークを使用するシステムの動作において使用される高水準コンポーネントのシステム図である。図１４の左に示されるように、所与のゴール画像Ｉ３０４は、静止（すなわち、既知であり、変化しない）ノイズ画像Ｎ３０５とともに、メタネットワークエンジン１４１０に提供される。メタネットワークエンジン１４１０は、具体的な特徴またはカラースペクトル（例えば、３つのネットワークメタネットワークにおいて、各ネットワークは、画像内の赤色、青色、および緑色のカラーバンドの各々のうちの１つに焦点を合わせ得る）など、ゴール画像Ｉ３０４の一部分に各々処理を実行する複数の単一のニューラルネットワークを含む「ニューラルネットワークのネットワーク」を含む。メタネットワークエンジン１４１０は、その内部の単一のネットワーク間の畳み込み訓練を使用して、ノイズ画像３０５からゴール画像３０４（または、その恣意的類似の再現）を再構築するために、任意の所与の画像復元エンジン３０９に適切なハイパーパラメータのセットθ３０２に到達する。このハイパーパラメータのセット３０２は、次いで、例えば、多くのクライアントが（例えば、写真またはビデオストリーミングサービスに有用であり得、同じコンテンツが多数の宛先に繰り返し送信されるように）計算されたハイパーパラメータの単一のセットからゴール画像３０４を再構築することを可能にするために、将来の使用を繰り返すために記憶され得、１つのエンドポイント３０１から別のエンドポイント３０７にネットワーク３０６を介して送信され得る。ネットワーク宛先では、受信したハイパーパラメータ３０８のセットが、ノイズ画像Ｉ３１１とともに入力として画像復元エンジン３０９に提供され、画像復元エンジン３０９がゴール画像の合理的に閉じた再現を生成し得るように、再作成された画像はＩ’３１０として示される。

図１５は、好ましい実施形態による、訓練画像のセットでメタネットワークを訓練するために使用され、ノイズ画像を入力画像の近似値に変換するために使用され得るフィルタを圧縮して求めるために使用される、メタネットワークエンジン１４１０のシステム概要図である。実施形態によれば、所与のゴール画像Ｉ３０４は、入力として静止ノイズ画像Ｎ３０５とともに、メタネットワークエンジン１４１０に提供される。メタネットワークエンジン１４１０は、訓練および変換プロセスと関連付けられた機械学習タスクを実行するためのプロセッサ１５４０とメモリ１５５９とを含む。ニューラルネットワーク１５１０は、動作のための適切なハイパーパラメータのセットに到達するために、機械学習アルゴリズム１５２０を使用して、訓練画像１５３０上で訓練し、ハイパーパラメータは、メタネットワークエンジン１４１０が、Ｎ３０５およびＩ３０４の入力が与えられた場合、ターゲット画像符号化ネットワークに記憶および伝送するための変更可能なハイパーパラメータのセット３０２を作成するために必要なハイパーパラメータのセットを含む。換言すれば、訓練によって決定されるハイパーパラメータのセットは、メタネットワークの動作のために使用されるセットであり、上記動作（正しい、訓練されたハイパーパラメータのセットが与えられた場合）は、次いで、ノイズ３０５およびターゲット３０４画像から所望のハイパーパラメータのセット３０２を生成する。

図１６は、実施形態による、特定のニューラルネットワーク構成１６４０を利用するシステムへの復元のためのデータを訓練、圧縮、および送信するためにメタネットワーク１６０２を利用する損失圧縮のためのシステム１６１０のデータフロー図である。実施形態によれば、メタネットワーク１６０２は、関数ｇをインスタンス化し、ｇは、既知のノイズ画像１６０３および元の画像１６０１を入力として与えられたとき、所与の元の画像Ｉ１６０１およびノイズ画像Ｎ１６０３についてのハイパーパラメータθ１６０４の特定のセットを入力として決定する。ハイパーパラメータ１６０４は、復元関数ｆ１６４０の具体的なインスタンスを定義するために、ニューラルネットワークに重みとして挿入されるとき（例えば、宛先デバイスにおいて）、ハイパーパラメータθ１６０４を生成するためにメタネットワーク１６０２内のｇへの入力として使用されるのと同じ既知／静止ノイズ画像１６３０をマッピングするために使用されることができる（ここで、「同じ」は、ノイズ画像１６３０がノイズ画像１６０３と同じ画像であることを意味する）。好ましい態様によれば、ハイパーパラメータθ１６０４は、入力としてノイズ画像Ｎ１６３０およびハイパーパラメータθ１６０４を与えられた場合、ｆが、元の画像Ｉのファクシミリである、ダビングされたＩ’１６５０を生成するような関数ｆを含む宛先画像符号化ネットワーク１６４０に伝送され得る。数学的に言えば、この動作は、関数のセット１６２０の形式をとる。

が与えられると、
ｇを求める
ｊ＝｛１，．．．，Ｋ｝：ｇ（Ｉｊ，Ｎ）：＝θ’ｊとなるように
ｆ（ｇ（Ｉｊ，Ｎ）｜Ｎ）：＝Ｉ’ｊ

図１７は、入力画像１７１１と同一の恣意的誤差制限内に近い、ノイズ画像１７０１を画像１７３０にマッピングするために使用され得る関数ｆの具体的なインスタンスを集合的に具体化する、ニューラルネットワーク１７２２、１７２４、および１７２６に挿入され得る、複数のフィルタ重みのセット１７２１、１７２３、１７２５のセットを生成するために、メタネットワーク１７１０内で互いに通信する多数の個々のニューラルネットワーク１７１０ａのシステム図である。示されるように、メタネットワーク１７１０は、元の画像１７１１の一部に焦点を当てた独立した機械学習タスクを各々実行する複数の個々のネットワークを含むニューラルネットワークのネットワークである。示されるように、１つの配設は、３つの個々のネットワークを使用する（および、本発明者は、この構成が、利用されるリソースの相対的な量に対して優れたパフォーマンスを提供し、画像圧縮タスクを数時間からミリ秒に低減することを実践を通じて決定した）が、代替のメタネットワーク配設は、２つの個々のネットワークのみを使用する、または４つ以上の個々のネットワークを使用するなどの実施形態によって可能である。

元の画像１７１１が個々のネットワーク１７１０ａへの入力として提供されるとき（この具体的な個々のネットワークのみが図内で強調表示されるが、これは明確にするために行われ、１７１０ａの動作の考察は、メタネットワーク１７１０に存在する任意のおよび全ての個々のネットワークに適用されることを理解されたい）、畳み込みフィルタ１７１４ａ～ｎのシーケンスが適用され、各フィルタの出力は、機械学習を可能にするために次への入力として提供され得る。各個々のネットワークの畳み込み出力はまた、別の個々のネットワークの処理１７１２ａ～ｎ、１７１３ａ～ｎにおける次の逐次フィルタへの入力として提供され得、これにより、ネットワークは、互いの処理から効果的に学習し、理想的な解決策をまとめて「ゼロイン（ｚｅｒｏｉｎ）」する。この畳み込み処理の後、いくつかの非畳み込み最終フィルタ１７１５ａ～ｎ、１７１６ａ～ｎ、１７１７ａ～ｎは、静止ノイズ画像１７０１を追加入力として、各個々のネットワークの出力（この場合、そのネットワークの出力のみ）に適用され得る。

これは、各フィルタが異なるように（単一のネットワークの処理のみに基づいており、したがって、ネットワークおよびそのそれぞれの出力および学習プロセスの差異に起因して互いに異なる）、元の画像の畳み込み、集合処理、ならびにノイズ画像に基づくネットワーク固有の処理の組み合わせ発展に基づいているフィルタ１７２１、１７２３、１７２５のセットを生成するが、フィルタの組み合わせは、ターゲット画像符号化ネットワーク１７２０に順次適用されるとき、元の画像１７１１の最終的な、恣意的類似の再構築１７３０に到達する前に、より正確な表現１７２２、１７２４、１７２６を連続的に再構築する。

図１７において、データは、従来のように、所与の畳み込みニューラルネットワーク内の層間（例えば、１７１２ａ～ｎ）で渡されることが分かるであろう。しかし、追加的に、メタネットワーク間接続は、態様によって、図１７に示されるように、メタネットワーク（例えば、１７１２ａ～ｎ）の１つのニューラルネットワーク（１つの水平列）の出力を、異なるニューラルネットワークの次の段階（１７１３ａ～ｎなどの異なる水平列）の入力にリンクすることによって行われる。これらのメタネットワーク間接続のない複数のメタネットワークのいくつかの初期テスト中に、訓練および品質の課題は、逢着された。訓練の課題は、消失勾配問題であった。これは、小さな値による連続的乗算のために、学習アルゴリズムが重みに対して行うことを欲する更新が極めて小さく（１０^－８ほどの）なるときに、発生する。これらの小さな更新は、ネットワークが「古く」なり、学習を停止、換言すれば、機能が改善を止める結果をもたらす。メタネットワーク内接続で行われるように、この問題は、メタネットワーク内の層間にスキップ接続を追加して、更新がそのパラメータに到達するためにとらなければならないルートを短縮し、更新が減少する順序を下げることによって修正され得る。この技術は、実質的な改善が指摘されながら、例示的な態様で完全に利用された。

情報の流れをさらに改善するために、メタネットワーク間経路は、追加される。これらは、メタネットワーク間の情報注入として機能する。彼らの主な役割は、従前のものの状態に関する現在のメタネットワークを更新することである。これは、訓練中の勾配情報の流れをさらに助け、時間を短縮しながら、より安定した訓練プロセスにつながる。

メタネットワーク間経路を追加する別の理由は、現在のメタネットワークが、生成された従前のネットワークのフィルタ（および、したがって、変換）を認識し、それをキャンセルするのではなく、従前のフィルタの変換を補完する方法でフィルタを生成し得ることである。従前のメタネットワークの状態を知るこの能力は、本発明の態様による画像符号化ネットワークにおける入力（ノイズ）への変換が典型的には順番に適用されるため、重要である。したがって、メタネットワークが特定の段階で変換を予測することをタスクとされている場合、既に適用されている従前の変換、換言すれば、従前のメタネットワーク行の状態を知っているべきである。

各メタネットワークは、画像符号化ネットワーク入力を所望の画像に近いステップに最も適切に変換するフィルタを予測することがタスクとされる。メタネットワークへの入力は、所望の画像（既知のノイズ画像は、図１７に示すように、レイヤー１７１５ａ～ｎで第１の行における後期に注入される）に過ぎないため、メタネットワークは、不完全な画像を表示している。「～から（Ｆｒｏｍ）」画像は、表示されないが、「～へ（ｔｏ）」画像のみ表示される。したがって、ＩＥＮ入力の後期融合（ノイズ）は、メタネットワークに提供されている。これは、メタネットワークがその予測を行うために使用できる情報を増加させ、画質に向上を与える。さらに、この情報の融合は、「または」方式で行われるため、メタネットワークは、それが要求するかどうかを選択することができる。

要約すると、図１７に示されるような態様による方法は、その方法がメタネットワークの集合またはグループを使用するので、メタネットワークの全体的効果（ｅｎｓｅｍｂｌｅ）と見なされ得る。それは同じネットワークである、と主張する人もいるかもしれず、しかしながら、全ての個々のメタネットワークは、訓練可能なパラメータ、入力、および出力に関して互いに独立しているため、これは誤りである。それは、一緒に訓練する必要さえないが、便利である。

メタネットワーク１７１０は、関数ｆがノイズ画像Ｎ１７０１をターゲット画像１７３０にマッピングするのに必要な重み１７２２、１７２３、１７２５を決定するその機能を実行することができる前に訓練されなければならない。したがって、図１８は、メタネットワークを使用する画像およびビデオの損失圧縮における使用のためにメタネットワーク１７１０を訓練するために必要なステップを図示する方法図である。初期ステップ１８１０において、訓練画像Ｊのセットは、入力としてメタネットワークに提供される。これらは、画像Ｊおよび所与のノイズ画像Ｎに基づいて、メタネットワークを訓練するために使用される（１８２０）。この訓練は、図１５において上で記載されるように、所与の元の画像Ｉの再構築に到達するために、ノイズ画像Ｎに適用するために必要なフィルタのセットに到着する（１８３０）。より詳細には、この再構築プロセスは、メタネットワーク内のいくつかの個々のネットワークを包含し、それらの各々は、ハイパーパラメータθのサブセットを生成し（１８４０）、それらの各々は、他のサブセットとは異なり、入力画像Ｉの具体的な部分または属性に焦点を当てる（１８５０）。その後の各個々のネットワークは、それらの集合的機械学習が、より小さく、より特化された畳み込みニューラルネットワークから構築された畳み込みニューラルネットワークとして使用されるように、全ての従前のネットワークの状態を入力としてとる（各々は、画像の具体的な属性に焦点を当て、全体的なメタネットワークは、各特定のネットワークをその独自の処理内の畳み込みフィルタとして使用することによって全体に焦点を当てる）（１８６０）。ターゲット画像を再構築するために、静止画像Ｎは、ネットワークによって発展された連続したフィルタを通過し（１８７０）、近似画像Ｉ’を生成する（１８８０）。近似画像が許容可能であると決定されるとき、そのハイパーパラメータのセットθが記憶され、訓練が完了したと見なされ、ハイパーパラメータθは、次いで、任意の恣意的数の宛先画像符号化ネットワークに送信され得（１８９０）、それらの各々は、次いで、再構築された画像Ｉ’を迅速に生成するために、ハイパーパラメータθおよびノイズ画像Ｎを使用し得る。

図１９は、実施形態による、画像符号化ネットワークｆのニューラルネットワークハイパーパラメータ予測のために、メタネットワーク内の単一のネットワークが画像のセットを訓練し、関数ｇの一部として動作するネットワークを生成するために実行するステップのフローチャートである。初期ステップ１９０１において、訓練画像ｊのセットは、メタネットワークに入力される。メタネットワーク内の各個々のネットワークにおいて、チェックは、ノイズ画像が存在するかどうかを決定するために実行される（１９０２）。ノイズ画像が存在しない場合、それが提供され（１９０３）、次いで、（または、ノイズ画像が既に存在していた場合）、メタネットワークは、訓練画像ｊ_ｎの各々上で画像変換関数ｇを実行する（１９０４）。変換を実行した後、結果がチェックされ、出力画像が所望の画像Ｉに許容可能に近接しているかどうかを決定し（１９０５）、そうでない場合、メタネットワーク内の各個々のネットワークは、そのパラメータをわずかに変更し（１９０６）、関数ｇを繰り返し、所望の出力結果に近接して反復する。再作成された画像Ｉ’が許容可能に元のＩに近いとき、ハイパーパラメータのセットは、許容可能な画像変換のために必要な許容可能なハイパーパラメータのセットとして記憶される（１９０７）。

図２０は、実施形態による、消失勾配問題を緩和するのに役立つ、静止画像を変換するための漸進的フィルタをクロス訓練および発展する目的のためにメタネットワーク内で通信する多数のネットワークのプロセスのフローチャートである。初期ステップ２０１０において、畳み込み処理層ｉは、メタネットワーク内の全ての単一のネットワークにわたって実行される。次いで、２０２０、チェックは、追加の層が存在するかどうかを決定するために実行され、実行されるのを待つ。そうである場合、次いで、各個々のネットワークは、そのそれぞれの処理層ｉの結果を出力として送信し、全ての次のネットワークの次の畳み込み層ｉ＋１の入力として使用される（２０４０）。次いで、ｉは、インクリメントし（２０５０）、動作を継続する（２０１０）。これ以上レイヤーが存在しないとき、畳み込み処理は終了し、各個々のネットワークは、次いで、それぞれのフィルタを生成し（２０３０）、それによって、ノイズ画像からターゲット画像を再現するために必要なフィルタの完全なセットを生成する。

ハードウェアアーキテクチャ
概して、本明細書に開示される技術は、ハードウェア上、またはソフトウェアとハードウェアの組み合わせに実装され得る。例えば、それらは、オペレーティングシステムカーネル内、別個のユーザプロセス内、ネットワークアプリケーションに結合されたライブラリパッケージ内、特別に構築されたマシン上、特定用途向け集積回路（「ＡＳＩＣ」）上、またはネットワークインターフェースカード上に実装され得る。

本明細書に開示される態様の少なくともいくつかのソフトウェア／ハードウェアハイブリッド実装形態は、メモリに記憶されたコンピュータプログラムによって選択的にアクティブ化または再構成された（断続的に接続されたネットワーク認識マシンを含むと理解されるべきである）プログラム可能なネットワーク常駐マシン上に実装され得る。このようなネットワークデバイスは、異なるタイプのネットワーク通信プロトコルを利用するように構成または設計され得る複数のネットワークインターフェースを有し得る。これらのマシンのいくつかの一般的なアーキテクチャは、所与の機能性の単位が実装され得る１つ以上の例示的な手段を例示するために、本明細書に記載され得る。具体的な態様によれば、本明細書に開示される様々な態様の特徴または機能性の少なくとも一部は、例えば、エンドユーザコンピュータシステム、クライアントコンピュータ、ネットワークサーバまたは他のサーバシステム、モバイルコンピューティングデバイス（例えば、タブレットコンピューティングデバイス、携帯電話、スマートフォン、ラップトップ、または他の好適なコンピューティングデバイス）、消費者用電子デバイス、音楽プレーヤ、または任意の他の好適な電子デバイス、ルータ、スイッチ、もしくは他の好適なデバイス、またはそれらの任意の組み合わせなど、１つ以上のネットワークと関連付けられた１つ以上の汎用コンピュータ上に実装され得る。少なくともいくつかの態様において、本明細書に開示される様々な態様の特徴または機能性の少なくともいくつかは、１つ以上の仮想化コンピューティング環境（例えば、ネットワークコンピューティングクラウド、１つ以上の物理コンピューティングマシン上にホストされる仮想マシン、または他の適切な仮想環境）に実装され得る。

ここで図２１を参照すると、本明細書に開示される特徴または機能性の少なくとも一部分を実装するのに好適な例示的なコンピューティングデバイス１０を示すブロック図が示される。コンピューティングデバイス１０は、例えば、従前のパラグラフに列挙されるコンピューティングマシンのいずれか１つであり得、実際には、メモリに記憶された１つ以上のプログラムによってソフトウェアベースまたはハードウェアベースの命令を実行することができる任意の他の電子デバイスであり得る。コンピューティングデバイス１０は、無線または有線を問わず、このような通信のための既知のプロトコルを使用して、ワイドエリアネットワーク、首都圏ネットワーク、ローカルエリアネットワーク、無線ネットワーク、インターネット、または他のネットワークなどの通信ネットワークを越えて、クライアントまたはサーバなどの複数の他のコンピューティングデバイスと通信するように構成され得る。

一実施形態において、コンピューティングデバイス１０は、１つ以上の中央処理ユニット（ＣＰＵ）１２と、１つ以上のインターフェース１５と、１つ以上のバス１４（周辺コンポーネント相互接続（ＰＣＩ）バスなど）とを含む。適切なソフトウェアまたはファームウェアの制御の下で動作するとき、ＣＰＵ１２は、具体的に構成されたコンピューティングデバイスまたは機械の機能と関連付けられた具体的な機能を実装するために応答可能あり得る。例えば、少なくとも一実施形態において、コンピューティングデバイス１０は、ＣＰＵ１２、ローカルメモリ１１および／またはリモートメモリ１６、およびインターフェース１５を利用するサーバシステムとして機能するように構成され得るか、または設計され得る。少なくとも１つの実施形態において、ＣＰＵ１２は、例えば、オペレーティングシステムおよび任意の適切なアプリケーションソフトウェア、ドライバなどを含み得るソフトウェアモジュールまたはコンポーネントの制御下で、異なるタイプの機能および／または動作の１つ以上を実行することを引き起こされ得る。

ＣＰＵ１２は、例えば、インテル（Ｉｎｔｅｌ）、ＡＲＭ、クアルコム（Ｑｕａｌｃｏｍｍ）、およびＡＭＤファミリーのマイクロプロセッサのうちの１つからのプロセッサなどの１つ以上のプロセッサ１３を含み得る。いくつかの実施形態において、プロセッサ１３は、コンピューティングデバイス１０の動作を制御するために、特定用途向け集積回路（ＡＳＩＣ）、電気的に消去可能なプログラム可能な読み取り専用メモリ（ＥＥＰＲＯＭ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）などの特別に設計されたハードウェアを含み得る。具体的な実施形態において、ローカルメモリ１１（例えば、１つ以上のレベルのキャッシュメモリを含む、不揮発性ランダムアクセスメモリ（ＲＡＭ）および／または読み取り専用メモリ（ＲＯＭ）など）はまた、ＣＰＵ１２の一部を形成し得る。しかしながら、メモリがシステム１０に結合され得る多くの異なる方式がある。メモリ１１は、例えば、データ、プログラミング命令などのキャッシュおよび／または記憶などの様々な目的のために使用され得る。ＣＰＵ１２は、モバイルデバイスまたは統合デバイスでの使用など、当該技術分野でますます一般的になりつつあるＱＵＡＬＣＯＭＭＳＮＡＰＤＲＡＧＯＮ（商標）またはＳＡＭＳＵＮＧＥＸＹＮＯＳ（商標）ＣＰＵなどのメモリまたはグラフィックスプロセッシングチップなどの追加のハードウェアを含み得る、様々なシステムオンチップ（ＳＯＣ）タイプのハードウェアの１つであり得ることをさらに理解されたい。

本明細書で使用される場合、「プロセッサ」という用語は、単にプロセッサ、モバイルプロセッサ、またはマイクロプロセッサとして当該技術分野で言及される集積回路に限定されるものではなく、広義には、マイクロコントローラ、マイクロコンピュータ、プログラマブルロジックコントローラ、特定用途向け集積回路、および任意の他のプログラマブル回路を指す。

一実施形態において、インターフェース１５は、ネットワークインターフェースカード（ＮＩＣ）として提供される。概して、ＮＩＣは、コンピュータネットワークを越えてデータパケットの送信および受信を制御し、他のタイプのインターフェース１５は、例えば、コンピューティングデバイス１０とともに使用される他の周辺機器をサポートし得る。提供され得るインターフェースの中には、イーサネット（Ｅｔｈｅｒｎｅｔ）インターフェース、フレームリレーインターフェース、ケーブルインターフェース、ＤＳＬインターフェース、トークンリングインターフェース、グラフィックスインターフェースなどがある。加えて、例えば、ユニバーサルシリアルバス（ＵＳＢ）、シリアル、イーサネット、ＦＩＲＥＷＩＲＥ（商標）、ＴＨＵＮＤＥＲＢＯＬＴ（商標）、ＰＣＩ、パラレル、無線周波数（ＲＦ）、ＢＬＵＥＴＯＯＴＨ（商標）、近接場通信（例えば、近接場磁気を使用して）、８０２．１１（ＷｉＦｉ）、フレームリレー、ＴＣＰ／ＩＰ、ＩＳＤＮ、高速イーサネットインターフェース、ギガビットイーサネットインターフェース、シリアルＡＴＡ（ＳＡＴＡ）または外部ＳＡＴＡ（ｅＳＡＴＡ）インターフェース、高精細マルチメディアインターフェース（ＨＤＭＩ）、デジタルビジュアルインターフェース（ＤＶＩ）、アナログもしくはデジタルオーディオインターフェース、非同期転送モード（ＡＴＭ）インターフェース、高速シリアルインターフェース（ＨＳＳＩ）インターフェース、ＰｏｉｎｔｏｆＳａｌｅ（ＰＯＳ）インターフェース、ファイバータ分散インターフェース（ＦＤＤＩ）などの様々なタイプのインターフェースが提供され得る。概して、そのようなインターフェース１５は、適切な媒体との通信に適切な物理ポートを含み得る。場合によっては、それらはまた、独立したプロセッサ（高忠実度Ａ／Ｖハードウェアインターフェースについての技術分野で一般的なような専用のオーディオまたはビデオプロセッサなど）、および場合によっては、揮発性および／または不揮発性メモリ（例えば、ＲＡＭ）を含み得る。

図２１に示されるシステムは、本明細書に記載される発明のうちの１つ以上を実装するためのコンピューティングデバイス１０のための１つの具体的なアーキテクチャを図示するが、それは決して、本明細書に記載される特徴および技術の少なくとも一部分が実装され得る唯一のデバイスアーキテクチャではない。例えば、１つまたは任意の数のプロセッサ１３を有するアーキテクチャが使用され得、そのようなプロセッサ１３は、単一のデバイス内に存在し得る、または任意の数のデバイス間に分散され得る。一実施形態において、単一のプロセッサ１３は、通信ならびにルーティング計算を扱い、他の実施形態において、別個の専用通信プロセッサが、提供され得る。様々な実施形態において、異なるタイプの特徴または機能性は、クライアントデバイス（タブレットデバイスまたはクライアントソフトウェアを実行するスマートフォンなど）およびサーバシステム（以下でより詳細に記載されるサーバシステムなど）を含む本発明によるシステムに実装され得る。

ネットワークデバイス構成に関係なく、本発明のシステムは、データ、汎用ネットワーク動作のためのプログラム命令、または本明細書に記載の実施形態の機能性に関連する他の情報（もしくは、上記の任意の組み合わせ）を記憶するように構成された１つ以上のメモリもしくはメモリモジュール（例えば、リモートメモリブロック１６およびローカルメモリ１１など）を採用し得る。プログラム命令は、例えば、オペレーティングシステムおよび／または１つ以上のアプリケーションの実行を制御し、または含み得る。メモリ１６またはメモリ１１、１６はまた、データ構造、構成データ、暗号化データ、履歴システム動作情報、または本明細書に記載される任意の他の具体的なまたは一般的な非プログラム情報を記憶するように構成され得る。

このような情報およびプログラム命令は、本明細書に記載の１つ以上のシステムまたは方法を実装するために用いられ得るため、少なくともいくつかのネットワークデバイスの実施形態は、例えば、本明細書に記載の様々な動作を実行するためのプログラム命令、状態情報などを記憶するように構成または設計され得る非一時的な機械可読記憶媒体を含み得る。そのような非一時的な機械可読記憶媒体の例は、ハードディスク、フロッピーディスク、および磁気テープなどの磁気媒体、ＣＤ－ＲＯＭディスクなどの光学媒体、読み取り専用メモリデバイス（ＲＯＭ）、フラッシュメモリ（モバイルデバイスおよび統合システムで一般的であるようなもの）、ソリッドステートドライブ（ＳＳＤ）、および単一のハードウェアデバイス（パーソナルコンピュータに関して当該技術分野でますます一般的になっているもの）におけるソリッドステートドライブおよびハードディスクドライブの物理的コンポーネントを組み合わせ得る「ハイブリッドＳＳＤ」記憶ドライブ、メモリスタメモリ、ランダムアクセスメモリ（ＲＡＭ）などのプログラム命令を記憶および実行するように特別に構成される、光学ディスク、およびハードウェアデバイスなどの磁気光学媒体を含むが、これらに限定されない。そのような記憶手段は、統合され得、取り外し不可能であり得（マザーボード上にはんだ付けされ得る、もしくは別様に電子デバイスに統合され得るＲＡＭハードウェアモジュールなど）、またはそれらは、スワップ可能なフラッシュメモリモジュール（「サムドライブ」または物理記憶デバイスを迅速に交換するように設計された他の取り外し可能な媒体など）、「ホットスワップ可能な」ハードディスクドライブもしくはソリッドステートドライブ、取り外し可能な光学記憶ディスク、または他のそのような取り外し可能な媒体などの取り外し可能であり得、そのような統合された取り外し可能な記憶媒体は、交換可能に利用され得ることを理解されたい。プログラム命令の例は、コンパイラによって生成され得るオブジェクトコード、アセンブラまたはリンカによって生成され得る、マシンコード、例えばＪＡＶＡ（商標）コンパイラによって生成され得、Ｊａｖａ仮想マシンまたは同等のものを使用して実行され得る、バイトコード、またはインタプリタを使用してコンピュータによって実行され得る、より高いレベルのコード（例えばＰｙｔｈｏｎ、Ｐｅｒｌ、Ｒｕｂｙ、Ｇｒｏｏｖｙ、または任意の他のスクリプト言語で書かれたスクリプト）を包含するファイルの両方を含む。

いくつかの実施形態において、本発明によるシステムは、スタンドアロンコンピューティングシステム上に実装され得る。ここで図２２を参照すると、スタンドアロンコンピューティングシステム上の１つ以上の実施形態またはそのコンポーネントの典型的な例示的なアーキテクチャを示すブロック図が示されている。コンピューティングデバイス２０は、例えば、クライアントアプリケーション２４などの、本発明の実施形態の１つ以上の機能またはアプリケーションを実行するソフトウェアを実行し得るプロセッサ２１を含む。プロセッサ２１は、例えば、あるバージョンのＭＩＣＲＯＳＯＦＴＷＩＮＤＯＷＳ（商標）オペレーティングシステム、ＡＰＰＬＥＯＳＸ（商標）またはｉＯＳ（商標）オペレーティングシステム、いくつかの種類のＬｉｎｕｘオペレーティングシステム、ＡＮＤＲＯＩＤ（商標）オペレーティングシステムなどのオペレーティングシステム２２の制御下でコンピューティング命令を実行し得る。多くの場合において、１つ以上の共有サービス２３は、システム２０で動作可能であり得、クライアントアプリケーション２４に共通のサービスを提供するために有用であり得る。サービス２３は、例えば、ＷＩＮＤＯＷＳ（商標）サービス、Ｌｉｎｕｘ環境におけるユーザ空間共通サービス、またはオペレーティングシステム２１とともに使用される任意の他のタイプの共通サービスアーキテクチャであり得る。入力デバイス２８は、例えば、キーボード、タッチスクリーン、マイクロフォン（例えば、音声入力用）、マウス、タッチパッド、トラックボール、またはそれらの任意の組み合わせを含む、ユーザ入力を受信するのに好適な任意のタイプであり得る。出力デバイス２７は、システム２０へのリモートであれローカルであれ、１つ以上のユーザに出力を提供するのに好適な任意のタイプのものであり得、例えば、可視出力のための１つ以上の画面、スピーカ、プリンタ、またはそれらの任意の組み合わせを含み得る。メモリ２５は、例えば、ソフトウェアを実行するためにプロセッサ２１によって使用されるために、当該技術分野で既知の任意の構造およびアーキテクチャを有するランダムアクセスメモリであり得る。記憶デバイス２６は、データをデジタル形式で記憶するための任意の磁気、光学、機械的、メモリスタ、または電気的記憶デバイスであり得る（図２１を参照して、上で記載されたものなど）。記憶デバイス２６の例は、フラッシュメモリ、磁気ハードドライブ、ＣＤ－ＲＯＭ、および／または同様のものを含む。

いくつかの実施形態において、本発明のシステムは、任意の数のクライアントおよび／またはサーバを有するものなどの分散コンピューティングネットワーク上に実装され得る。ここで図２３を参照すると、本発明の実施形態によるシステムの少なくとも一部分を分散コンピューティングネットワーク上に実装するための例示的なアーキテクチャ３０を示すブロック図が示される。実施形態によれば、任意の数のクライアント３３が、提供され得る。各クライアント３３は、本発明のクライアント側部分を実装するためのソフトウェアを実行し得、クライアントは、図２２に図示されるようなシステム２０を含み得る。加えて、任意の数のサーバ３２は、１つ以上のクライアント３３から受信された要求を扱うために提供され得る。クライアント３３およびサーバ３２は、インターネット、ワイドエリアネットワーク、モバイル電話ネットワーク（ＣＤＭＡまたはＧＳＭセルラネットワークなど）、無線ネットワーク（ＷｉＦｉ、ＷｉＭＡＸ、ＬＴＥなど）、またはローカルエリアネットワーク（または実際には当該技術分野で既知の任意のネットワークトポロジーであり、本発明は他のネットワークトポロジーを越えた任意の１つを好まない）の様々な実施形態であり得る、１つ以上の電子ネットワーク３１を介して互いに通信し得る。ネットワーク３１は、例えば有線および／または無線プロトコルを含む任意の既知のネットワークプロトコルを使用して実装され得る。

加えて、いくつかの実施形態において、サーバ３２は、追加情報を取得するために、または特定の呼び出しに関する追加データを参照するために必要なときに、外部サービス３７を呼び出し得る。外部サービス３７との通信は、例えば、１つ以上のネットワーク３１を介して行われ得る。様々な実施形態において、外部サービス３７は、ハードウェアデバイス自体に関連する、またはハードウェアデバイス自体にインストールされるウェブ対応サービスまたは機能性を含み得る。例えば、クライアントアプリケーション２４がスマートフォンまたは他の電子デバイスに実装される実施形態において、クライアントアプリケーション２４は、クラウド内のサーバシステム３２に、または特定のエンタープライズもしくはユーザの敷地の１つ以上に展開された外部サービス３７に記憶された情報を取得し得る。

本発明のいくつかの実施形態において、クライアント３３またはサーバ３２（またはその両方）は、１つ以上のネットワーク３１にわたってローカルまたはリモートに展開され得る１つ以上の特化されたサービスまたは機器を利用し得る。例えば、１つ以上のデータベース３４は、本発明の１つ以上の実施形態によって使用または参照され得る。データベース３４は、多種多様なアーキテクチャに配設され得、多種多様なデータアクセスおよび操作手段を使用し得ることが当業者によって理解されるべきである。例えば、様々な実施形態において、１つ以上のデータベース３４は、構造化クエリ言語（ＳＱＬ）を使用する関係データベースシステムを含み得、他のデータベースは、例えば、「ＮｏＳＱＬ」として当該技術分野で言及されるもの（例えば、ＨＡＤＯＯＰＣＡＳＳＡＮＤＲＡ（商標）、ＧＯＯＧＬＥＢＩＧＴＡＢＬＥ（商標）など）などの代替データ記憶技術を含み得る。いくつかの実施形態において、本発明によって、列指向データベース、メモリ内データベース、クラスタ化データベース、分散データベース、または平坦ファイルデータリポジトリなどのバリアントデータベースアーキテクチャが使用され得る。具体的なデータベース技術またはコンポーネントの具体的な配設が本明細書の特定の実施形態に対して指定されない限り、既知または将来のデータベース技術の任意の組み合わせが適切に使用され得ることが当業者によって理解されるであろう。さらに、本明細書で使用される場合、「データベース」という用語は、物理データベースマシン、単一のデータベースシステムとして機能するマシンのクラスタ、または全体のデータベース管理システム内の論理データベースを指し得ることを理解されたい。「データベース」という用語の所与の使用に対して具体的な意味が指定されない限り、それは、単語のこれらの感覚のいずれかを意味すると解釈されるべきであり、それらの全ては、当業者によって「データベース」という用語の平易な意味として理解される。

同様に、本発明のほとんどの実施形態は、１つ以上のセキュリティシステム３６および構成システム３５を使用し得る。セキュリティおよび構成管理は、一般的な情報技術（ＩＴ）およびＷｅｂ機能であり、各々の一部は、概して任意のＩＴまたはＷｅｂシステムと関連付けられている。現在または将来の当該技術分野で既知の任意の構成またはセキュリティサブシステムが、特定のセキュリティ３６もしくは構成システム３５またはアプローチが具体的な実施形態の記載によって具体的に必要とされない限り、限定されないが、本発明の実施形態と併せて使用され得ることを当業者は理解すべきである。

図２４は、システム全体の様々な場所のうちのいずれかで使用され得るコンピュータシステム４０の例示的な概要を示す。データを処理するためにコードを実行し得る任意のコンピュータの例示である。様々な修正および変更は、本明細書に開示されるシステムおよび方法のより広範な範囲から逸脱することなく、コンピュータシステム４０に対して行われ得る。中央プロセッサユニット（ＣＰＵ）４１は、バス４２に接続されており、バスはまた、メモリ４３、不揮発性メモリ４４、ディスプレイ４７、入力／出力（Ｉ／Ｏ）ユニット４８、およびネットワークインターフェースカード（ＮＩＣ）５３に接続されている。Ｉ／Ｏユニット４８は、典型的には、キーボード４９、ポインティングデバイス５０、ハードディスク５２、およびリアルタイムクロック５１に接続され得る。ＮＩＣ５３は、インターネットまたはローカルネットワークであり得るネットワーク５４に接続し、ローカルネットワークは、インターネットへの接続を有する場合があるか、または有しない場合がある。システム４０の一部としてまた示されるのは、この例において、主交流（ＡＣ）電源４６に接続された電源ユニット４５である。存在し得る電池、および周知であるが、本明細書に開示される現在のシステムおよび方法の特定の新規な機能には適用されない多くの他のデバイスおよび修正は、示されていない。例示されるいくつかのまたは全てのコンポーネントは、例えば、クアルコムもしくはサムスンシステムオンアチップ（ＳＯＣ）デバイスなどの様々な統合アプリケーションにおいて、または複数の能力もしくは機能を単一のハードウェアデバイス（例えば、スマートフォン、ビデオゲームコンソールなどのモバイルデバイス、自動車のナビゲーションもしくはマルチメディアシステムなどの車載コンピュータシステム、または他の統合されたハードウェアデバイスなど）に組み合わせることが適切であり得るときなどに、組み合わせられ得ることを理解されたい。

様々な実施形態において、本発明のシステムまたは方法を実装するための機能は、任意の数のクライアントおよび／またはサーバコンポーネント間で分散され得る。例えば、様々なソフトウェアモジュールは、本発明に関連して様々な機能を実行するために実装され得、そのようなモジュールは、サーバおよび／またはクライアントコンポーネントで実行するために様々に実装され得る。

当業者は、上で記載の様々な実施形態の可能な修正の範囲を認識するであろう。したがって、本発明は、特許請求の範囲およびそれらの等価物によって定義される。

Claims

メタネットワークを利用する損失画像およびビデオ圧縮のためのシステムであって、
プロセッサと、メモリと、前記メモリに記憶された第１の複数のプログラミング命令と、を含む、メタネットワークエンジンを含み、前記第１の複数のプログラミング命令が、前記プロセッサ上で動作するときに、前記プロセッサに、
所望の画像を受信することと、
ノイズ画像を受信することと、
訓練画像のセットを受信することと、
前記訓練画像のセットの各々に前記ノイズ画像をマッピングすることによって、前記訓練画像のセットの各々を再構築するために、前記訓練画像のセットを使用して、複数のニューラルネットワークを訓練することと、
メタネットワークハイパーパラメータのセットとして、前記複数のニューラルネットワークの各々についての前記パラメータを記憶することと、
前記複数のニューラルネットワークの各々についての動作パラメータとして、前記メタネットワークハイパーパラメータのセットを使用することと、
前記複数のニューラルネットワークを使用して、前記所望の画像に前記ノイズ画像をマッピングし、前記複数のニューラルネットワークの各々の前記動作から生成された特定のフィルタに対応する第２のハイパーパラメータのセットを生成し、そのため、前記第２のハイパーパラメータのセットが、前記ニューラルネットワークを使用して前記ノイズ画像に適用されるとき、所定の閾値未満である誤差内の前記所望の画像の近似値を生成することと、
前記第２のセットのハイパーパラメータを、将来の画像マッピング動作で使用するために記憶することと、を行わせる、システム。
前記複数のニューラルネットワークの各々が、
少なくとも１つの畳み込みフィルタを生成することであって、前記ノイズ画像が、全ての畳み込みフィルタを通して連続してフィルタリングされ得、それを所望の画像の近似値にマッピングする、生成することと、
消失勾配問題を緩和するために、前記複数のニューラルネットワーク間の通信を容易にすることと、を行う、請求項１に記載のシステム。
前記複数のニューラルネットワークが、ネットワークにわたって接続された別個のコンピューティングデバイス上に位置し得る、請求項２に記載のシステム。
前記ノイズ画像が、静的であり、かつ変化しない、請求項１に記載のシステム。
メタネットワークを利用する損失画像圧縮のための方法であって、
所望の画像を受信するステップと、
ノイズ画像を受信するステップと、
訓練画像のセットを受信するステップと、
前記訓練画像のセットの各々に前記ノイズ画像をマッピングすることによって、前記訓練画像のセットの各々を再構築するために、前記訓練画像のセットを使用して、複数のニューラルネットワークを訓練するステップと、
メタネットワークハイパーパラメータのセットとして、前記複数のニューラルネットワークの各々についての前記パラメータを記憶するステップと、
前記複数のニューラルネットワークの各々についての動作パラメータとして、前記メタネットワークハイパーパラメータのセットを使用するステップと、
前記複数のニューラルネットワークを使用して、前記所望の画像に前記ノイズ画像をマッピングし、前記複数のニューラルネットワークの各々の前記動作から生成された特定のフィルタに対応する第２のハイパーパラメータのセットを生成し、そのため、前記第２のハイパーパラメータのセットが、前記ニューラルネットワークを使用して前記ノイズ画像に適用されるとき、所定の閾値未満である誤差内の前記所望の画像の近似値を生成する、ステップと、
前記第２のセットのハイパーパラメータを、将来の画像マッピング動作で使用するために記憶するステップと、を含む、方法。
前記複数のニューラルネットワークの各々において、少なくとも１つの畳み込みフィルタを生成するステップであって、ノイズ画像が、前記畳み込みフィルタを通して連続してフィルタリングされ得、複数のニューラルメタネットワークを使用して、それを所望の画像の近似値にマッピングする、生成するステップと、
消失勾配問題を緩和するために、前記複数のニューラルネットワーク間の通信を容易にするステップと、をさらに含む、請求項５に記載の方法。
前記複数のニューラルネットワークが、ネットワークにわたって接続された別個のコンピューティングデバイス上に位置し得る、請求項６に記載の方法。
前記ノイズ画像が、静的であり、かつ変化しない、請求項５に記載の方法。
ニューラルネットワークを利用する損失画像およびビデオ圧縮ならびに伝送のためのシステムであって、
第１のプロセッサと、第１のメモリと、前記第１のメモリに記憶された第１の複数のプログラミング命令と、を含む、画像圧縮エンジンを含み、前記第１の複数のプログラミング命令が、前記第１のプロセッサ上で動作するときに、前記第１のプロセッサに、
所望の画像を受信することと、
ノイズ画像を回収することと、
ハイパーパラメータを求めるために、第１のニューラルネットワークを使用して前記ノイズ画像を前記所望の画像にマッピングさせることであって、前記ハイパーパラメータが、前記第１のニューラルネットワークを使用して前記ノイズ画像に適用されるとき、所定の閾値未満である誤差内で前記所望の画像の近似値を生成するように、マッピングすることと、
前記ハイパーパラメータを伝送することと、を行わせ、
第２のプロセッサと、第２のメモリと、前記メモリに記憶された第２の複数のプログラミング命令と、を含む、画像復元エンジンを含み、前記第２の複数のプログラミング命令が、前記第２のプロセッサ上で動作するときに、前記第２のプロセッサに、
前記ハイパーパラメータを受信することと、
前記ノイズ画像を回収することと、
前記所定の閾値未満である誤差内で前記所望の画像の近似値を生成するために、第２のニューラルネットワークを使用して前記ノイズ画像に前記ハイパーパラメータを適用することと、を行わせる、システム。
前記画像圧縮エンジンが、前記第１のニューラルネットワークの前記動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む、請求項９に記載のシステム。
前記画像復元エンジンが、前記第２のニューラルネットワークの前記動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む、請求項９に記載のシステム。
ニューラルネットワークを利用する損失画像およびビデオ圧縮ならびに伝送のための方法であって、
第１のコンピューティングデバイスにおいて、所望の画像を受信するステップと、
前記第１のコンピューティングデバイスを使用して、ノイズ画像を回収するステップと、
第１のニューラルネットワークを使用してハイパーパラメータを求めるために、前記第１のコンピューティングデバイスを使用して、前記ノイズ画像を前記所望の画像にマッピングし、そのため、前記ハイパーパラメータが、前記第１のニューラルネットワークを使用して前記ノイズ画像に適用されるとき、所定の閾値未満である誤差内で前記所望の画像の近似値を生成する、ステップと、
前記ハイパーパラメータを第２のコンピューティングデバイスに伝送するステップと、
第２のコンピューティングデバイスにおいて、前記ハイパーパラメータを受信するステップと、
前記第２のコンピューティングデバイスにおいて、前記ノイズ画像を回収するステップと、
第２のニューラルネットワークを使用して前記所定の閾値未満である誤差内で前記所望の画像の近似値を生成するために、前記第２のコンピューティングデバイスを使用して、前記ノイズ画像に前記ハイパーパラメータを適用ステップと、を含む、方法。
前記画像圧縮エンジンが、前記第１のニューラルネットワークの前記動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む、請求項１２に記載の方法。
前記画像復元エンジンが、前記第２のニューラルネットワークの前記動作を加速するための専用の２Ｄ畳み込みプロセッサをさらに含む、請求項１２に記載のシステム。