JP2023501472A

JP2023501472A - 映像データをコーディングするための方法、コンピュータシステム、及びコンピュータプログラム

Info

Publication number: JP2023501472A
Application number: JP2022526721A
Authority: JP
Inventors: ペリンガーサリークリシュナン，マドゥー; ジャオ，シン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-05-29
Filing date: 2021-02-02
Publication date: 2023-01-18
Anticipated expiration: 2041-02-02
Also published as: US11785254B2; EP3984232A1; JP7444979B2; JP2024054392A; WO2021242332A1; US20210377563A1; EP3984232A4; KR20220031715A; US20230403410A1; CN114503589A

Abstract

映像データをコーディングするための方法、コンピュータプログラム、及びコンピュータシステムが提供される。映像データが受信され、映像データに対応するハイブリッド変換カーネルのセットが特定される。ハイブリッド変換カーネルのセットの中から、明示的に、又は黙示的に、のいずれかで、ハイブリッド変換カーネルのサブセットが選択される。選択されたハイブリッド変換カーネルのサブセットに基づいて映像データが復号される。

Description

この出願は、２０２０年５月２９日に出願された米国仮特許出願第６３／０３２，２１６号、及び２０２０年１０月９日に出願された米国特許出願第１７／０６６，７９１号からの優先権を主張するものであり、それらの全体をここに援用する。

この開示は、概してデータ処理の分野に関し、より具体的には映像符号化及び復号に関する。

ＡＯＭｅｄｉａＶｉｄｅｏ１（ＡＶ１）は、インターネット上での映像伝送向けに設計されたオープンな映像コーディングフォーマットである。これは、半導体企業、ビデオ・オン・デマンドプロバイダ、ビデオコンテンツ制作者、ソフトウェア開発企業、ウェブブラウザベンダを含んで２０１５年に設立されたコンソーシアムであるＡｌｌｉａｎｃｅｆｏｒＯｐｅｎＭｅｄｉａ（ＡＯＭｅｄｉａ）によって、ＶＰ９の後継として開発されたものである。ＡＶ１プロジェクトのコンポーネントの多くは、アライアンスメンバによるそれまでの研究努力をもとにしたものである。個々の寄稿者は何年も前から試験的な技術プラットフォームを開始しており、Ｘｉｐｈ／ＭｏｚｉｌｌａのＤａａｌａは２０１０年に既にコードを公開し、Ｇｏｏｇｌｅの試験的なＶＰ９進化プロジェクトＶＰ１０が２０１４年９月１２日に発表され、ＣｉｓｃｏのＴｈｏｒが２０１５年８月１１日に発表している。ＶＰ９のコードベースに基づいて、ＡＶ１は追加の技術を組み込んでおり、それらの一部はこれらの試験的なフォーマットで開発されたものである。ＡＶ１リファレンスコーデックの最初のバージョン０．１．０が２０１６年４月７日に公表された。当該アライアンスは、２０１８年３月２８日に、ＡＶ１ビットストリーム仕様のリリースを、リファレンスのソフトウェアベースのエンコーダ及びデコーダと共に発表した。２０１８年６月２５日に、検証済みのバージョン１．０．０の仕様がリリースされた。２０１９年１月８日に、Ｅｒｒａｔａ１の仕様を備えた検証済みバージョン１．０．０がリリースされた。ＡＶ１ビットストリーム仕様は、リファレンスビデオコーデックを含んでいる。

実施形態は、映像データをコーディングするための方法、システム、及びコンピュータ読み取り可能媒体に関する。一態様によれば、映像データをコーディングするための方法が提供される。当該方法は、映像データを受信することを含み得る。映像データに対応するハイブリッド変換カーネルのセットが特定される。ハイブリッド変換カーネルのセットの中から、明示的に、又は黙示的に、のいずれかで、ハイブリッド変換カーネルのサブセットが選択される。選択されたハイブリッド変換カーネルのサブセットに基づいて映像データが復号される。

他の一態様によれば、映像データをコーディングするためのコンピュータシステムが提供される。当該コンピュータシステムは、１つ以上のプロセッサ、１つ以上のコンピュータ読み取り可能メモリ、１つ以上のコンピュータ読み取り可能な有形ストレージ装置、及び上記１つ以上のメモリのうちの少なくとも１つを介した上記１つ以上のプロセッサのうちの少なくとも１つによる実行するために上記１つ以上のストレージ装置のうちの少なくとも１つに格納されたプログラム命令と、を含むことができ、それにより当該コンピュータシステムは方法を実行することができる。当該方法は、映像データを受信することを含み得る。映像データに対応するハイブリッド変換カーネルのセットが特定される。ハイブリッド変換カーネルのセットの中から、明示的に、又は黙示的に、のいずれかで、ハイブリッド変換カーネルのサブセットが選択される。選択されたハイブリッド変換カーネルのサブセットに基づいて映像データが復号される。

他の一態様によれば、映像データをコーディングするためのコンピュータ読み取り可能媒体が提供される。当該コンピュータ読み取り可能媒体は、１つ以上のコンピュータ読み取り可能ストレージ装置と、該１つ以上の有形のストレージ装置のうちの少なくとも１つに格納された、プロセッサによって実行可能なプログラム命令と、を含み得る。当該プログラム命令は、それに従って映像データを受信することを含み得る方法を実行するようにプロセッサによって実行可能である。映像データに対応するハイブリッド変換カーネルのセットが特定される。ハイブリッド変換カーネルのセットの中から、明示的に、又は黙示的に、のいずれかで、ハイブリッド変換カーネルのサブセットが選択される。選択されたハイブリッド変換カーネルのサブセットに基づいて映像データが復号される。

これらの及び他の目的、特徴及び利点が、添付の図面との関連で読まれるものである以下の例示的実施形態の詳細な説明から明らかになる。これらの図示は、詳細な説明とともに当業者の理解を容易にする上での明瞭さのためのものであり、図面の様々なフィーチャは縮尺通りではない。
少なくとも１つの実施形態に従ったネットワーク化コンピュータ環境を示している。少なくとも１つの実施形態に従った、例示的な線グラフ変換である。少なくとも１つの実施形態に従った、黙示的又は明示的にハイブリッド変換カーネルを選択することに基づいて映像データをコーディングするプログラムによって実行されるステップを示す動作フローチャートである。少なくとも１つの実施形態に従った、図１に示したコンピュータ及びサーバの内部及び外部コンポーネントのブロック図である。少なくとも１つの実施形態に従った、図１に示したコンピュータシステムを含む例示的なクラウドコンピューティング環境のブロック図である。少なくとも１つの実施形態に従った、図５の例示的なクラウドコンピューティング環境の機能層のブロック図である。

特許請求される構造及び方法の詳細な実施形態がここに記載されるが、理解され得ることには、開示される実施形態は、単に、様々な形態で具現化され得る特許請求される構造及び方法を例示するものに過ぎない。これらの構造及び方法は、数多くの異なる形態で具体化されることができ、ここに記載される例示的な実施形態に限定されるものとして解釈されるべきでない。むしろ、これら例示的な実施形態は、この開示が徹底的であり且つ完成したものであって範囲を当業者に十分に伝えることになるように提供されるものである。説明において、周知の機構及び技術の詳細は、提示する実施形態をいたずらに不明瞭にすることがないよう、省略されることがある。

実施形態は、概してデータ処理の分野に関し、より具体的には映像符号化及び復号に関する。以下に記載される例示的な実施形態は、とりわけ、黙示的に又は明示的に、のいずれかでハイブリッド変換カーネルを選択することに基づいて映像データを符号化及び復号するためのシステム、方法、及びコンピュータプログラムを提供する。従って、一部の実施形態は、映像データからコンピュータによって黙示され得るハイブリッド変換カーネルの使用を通じて、高められたコーディング効率を可能にすることによって、コンピューティングの分野を改善する能力を持つ。

前述のように、ＡＯＭｅｄｉａＶｉｄｅｏ１（ＡＶ１）は、インターネット上での映像伝送向けに設計されたオープンな映像コーディングフォーマットである。これは、半導体企業、ビデオ・オン・デマンドプロバイダ、ビデオコンテンツ制作者、ソフトウェア開発企業、ウェブブラウザベンダを含んで２０１５年に設立されたコンソーシアムであるＡｌｌｉａｎｃｅｆｏｒＯｐｅｎＭｅｄｉａ（ＡＯＭｅｄｉａ）によって、ＶＰ９の後継として開発されたものである。ＡＶ１プロジェクトのコンポーネントの多くは、アライアンスメンバによるそれまでの研究努力をもとにしたものである。個々の寄稿者は何年も前から試験的な技術プラットフォームを開始しており、Ｘｉｐｈ／ＭｏｚｉｌｌａのＤａａｌａは２０１０年に既にコードを公開し、Ｇｏｏｇｌｅの試験的なＶＰ９進化プロジェクトＶＰ１０が２０１４年９月１２日に発表され、ＣｉｓｃｏのＴｈｏｒが２０１５年８月１１日に発表している。ＶＰ９のコードベースに基づいて、ＡＶ１は追加の技術を組み込んでおり、それらの一部はこれらの試験的なフォーマットで開発されたものである。ＡＶ１リファレンスコーデックの最初のバージョン０．１．０が２０１６年４月７日に公表された。当該アライアンスは、２０１８年３月２８日に、ＡＶ１ビットストリーム仕様のリリースを、リファレンスのソフトウェアベースのエンコーダ及びデコーダと共に発表した。２０１８年６月２５日に、検証済みのバージョン１．０．０の仕様がリリースされた。２０１９年１月８日に、Ｅｒｒａｔａ１の仕様を備えた検証済みバージョン１．０．０がリリースされた。ＡＶ１ビットストリーム仕様は、リファレンスビデオコーデックを含んでいる。

各コーディングブロックが１つの変換タイプしか持たないＶＰ９とは異なり、ＡＶ１は各変換ブロックが独立してそれ自身の変換カーネルを選択することを可能にする。ＡＶ１は、イントラ予測残差をコーディングするためにハイブリッド変換カーネルのセットを利用する。ハイブリッド変換カーネルは、一般に、例えばＤＣＴ、ＡＤＳＴ、逆ＡＤＳＴ（ＦＬＩＰＡＤＤＳＴ）及びアイデンティティ変換（ＩＤＴＸ）などの、様々な１Ｄカーネルの組み合わせに拡張される２Ｄ分離可能変換カーネルを指す。ハイブリッド変換カーネルのセット、及びルマイントラ予測残差に対するそれらの利用可能性は、残差ブロックのサイズに依存する。クロマイントラ予測残差に対して、変換タイプ選択は、イントラ予測モードに依存して黙示的なやり方で行われる。しかしながら、ＡＶ２開発プロセスにおけるＬＧＴ（及びその逆バージョン）及びＫＬＴの導入に伴い、ルマ及びクロマイントラ予測残差をコーディングするのに利用可能なハイブリッド変換カーネルのセットが拡張している。この拡張セットから特定のハイブリッド変換タイプを選択し、それらを残留コーディングブロック各々に対してビットストリーム内でシグナリングすることは、追加の計算複雑性及びビットレートオーバヘッドを招く。従って、コーディング性能を改善しながら、計算複雑性及びビットレートオーバヘッドも低減させるために、残差の大きさにおける変化の方向性を利用すべく、イントラモード依存且つ残差ブロックサイズ依存のＬＧＴ及びＫＬＴを使用することが有利であり得る。

ここでは態様を、様々な実施形態に従った方法、装置（システム）、及びコンピュータ読み取り可能媒体のフローチャート図及び／又はブロック図を参照して説明する。理解されることには、フローチャート図及び／又はブロック図の各ブロック、並びにフローチャート図及び／又はブロック図におけるブロックの組み合わせは、コンピュータ読み取り可能プログラム命令によって実装されることができる。

次に、黙示的又は明示的にハイブリッド変換カーネルを選択することに基づいて映像データを符号化及び復号するための映像コーディングシステム１００（以下、“システム”）を示すネットワーク化コンピュータ環境の機能ブロック図である図１を参照する。理解されるべきことには、図１は、単に一実装の例示を提供するにすぎず、複数の異なる実施形態が実装され得る環境に関する如何なる限定も意味しない。図示された環境に対する数多くの変更が、設計及び実装要件に基づいて為され得る。

システム１００は、コンピュータ１０２及びサーバコンピュータ１１４を含み得る。コンピュータ１０２は、通信ネットワーク１１０（以下、“ネットワーク”）を介してサーバコンピュータ１１４と通信し得る。コンピュータ１０２は、プロセッサ１０４と、データストレージ装置１０６に格納されたソフトウェアプログラム１０８とを含むことができ、ユーザとインタフェースし、サーバコンピュータ１１４と通信することを可能にされる。図４を参照して後述するように、コンピュータ１０２は、内部コンポーネント８００Ａ及び外部コンポーネント９００Ａをそれぞれ含むことができ、サーバコンピュータ１１４は、内部コンポーネント８００Ｂ及び外部コンポーネント９００Ｂをそれぞれ含むことができる。コンピュータ１０２は、例えば、モバイル装置、電話、携帯情報端末、ネットブック、ラップトップコンピュータ、タブレットコンピュータ、デスクトップコンピュータ、又は、プログラムを実行し、ネットワークにアクセスし、及びデータベースにアクセスすることが可能な任意のタイプのコンピューティング装置とし得る。

サーバコンピュータ１１４はまた、図５及び図６に関して後述するように、例えばソフトウェア・アズ・ア・サービス（ＳａａＳ）、プラットフォーム・アズ・ア・サービス（ＰａａＳ）、又はインフラストラクチャ・アズ・ア・サービス（ＩａａＳ）などの、クラウドコンピューティングサービスモデルにて動作してもよい。サーバコンピュータ１１４はまた、例えばプライベートクラウド、コミュニティクラウド、パブリッククラウド、又はハイブリッドクラウドなどの、クラウドコンピューティング展開モデル内に置かれてもよい。

黙示的又は明示的にハイブリッド変換カーネルを選択することに基づいて映像データをコーディングするために使用され得るものであるサーバコンピュータ１１４は、データベース１１２とインタラクトし得る映像コーディングプログラム１１６（以下、“プログラム”という）を実行することを可能にされている。映像コーディングプログラム方法については、後で図３に関して更に詳細に説明する。一実施形態において、コンピュータ１０２は、ユーザインタフェースを含む入力装置として動作することができ、一方、プログラム１１６は、主としてサーバコンピュータ１１４上で走り得る。代わりの一実施形態において、プログラム１１６は主として１つ以上のコンピュータ１０２上で走ってもよく、サーバコンピュータ１１４は、プログラム１１６によって使用されるデータの処理及びストレージのために使用されてもよい。なお、プログラム１１６は、スタンドアローンのプログラムであってもよいし、より大きい映像コーディングプログラムに統合されてもよい。

しかしながら、留意されたいことには、プログラム１１６のための処理は、一部の例において、コンピュータ１０２とサーバコンピュータ１１４との間で任意の比率で共有されてもよい。他の一実施形態において、プログラム１１６は、２つ以上のコンピュータ、サーバコンピュータ、又はコンピュータとサーバコンピュータとの何らかの組み合わせ、例えば、ネットワーク１１０を横切って単一のサーバコンピュータ１１４と通信する複数のコンピュータ１０２、の上で動作し得る。他の一実施形態において、例えば、プログラム１１６は、ネットワーク１１０を横切って複数のクライアントコンピュータと通信する複数のサーバコンピュータ１１４上で動作し得る。あるいは、プログラムは、ネットワークを横切ってサーバ及び複数のクライアントコンピュータと通信するネットワークサーバ上で動作してもよい。

ネットワーク１１０は、有線接続、無線接続、光ファイバ接続、又はこれらの何らかの組み合わせを含み得る。一般に、ネットワーク１１０は、コンピュータ１０２とサーバコンピュータ１１４との間での通信をサポートする接続及びプロトコルの任意の組み合わせとすることができる。ネットワーク１１０は、例えばローカルエリアネットワーク（ＬＡＮ）、インターネットなどのワイドエリアネットワーク（ＷＡＮ）、公衆交換電話ネットワーク（ＰＳＴＮ）などの遠隔通信ネットワーク、無線ネットワーク、公衆交換ネットワーク、衛星ネットワーク、セルラネットワーク（例えば、第５世代（５Ｇ）ネットワーク、ロングタームエボリューション（ＬＴＥ）ネットワーク、第３世代（３Ｇ）ネットワーク、符号分割多重アクセス（ＣＤＭＡ）ネットワークなど）、公衆陸上モバイルネットワーク（ＰＬＭＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）、プライベートネットワーク、アドホックネットワーク、イントラネット、光ファイバベースのネットワーク、若しくはこれらに類するもの、及び／又はこれらの若しくは他のタイプのネットワークの組合せなどの、様々なタイプのネットワークを含み得る。

図１に示す装置及びネットワークの数及び構成は、一例として提供されている。実際には、図１に示すものに対して、追加の装置及び／又はネットワーク、より少ない装置及び／又はネットワーク、異なる装置及び／又はネットワーク、又は異なるように構成された装置及び／又はネットワークが存在し得る。さらに、図１に示す２つ以上の装置が単一の装置内に実装されてもよいし、あるいは図１に示す単一の装置が複数の分散された装置として実装されてもよい。加えて、あるいは代わりに、システム１００の一組の装置（例えば、１つ以上の装置）が、システム１００の別の一組の装置によって実行されるものとして説明される１つ以上の機能を実行してもよい。

次に図２を参照するに、例示的な線グラフ変換（line graph transform；ＬＧＴ）２００が示されている。グラフは、関心オブジェクト間の親和（アフィニティ）関係をモデル化するのに使用される頂点及びエッジのセットで構成される一般的な数学的構造とし得る。実際には、重み付きグラフ（それに対して、重みのセットがエッジ及び場合により頂点に割り当てられる）が、信号／データのロバストなモデル化のためのスパース表現を提供し得る。ＬＧＴは、多様なブロック統計量に対するより良い適応を提供することによってコーディング効率を改善することができる。分離可能なＬＧＴは、ブロック残差信号の、内在する行及び列的な統計量をモデル化するために、データから線グラフを学習することによって設計及び最適化されることができ、関連する一般化グラフラプラシアン（generalized graph Laplacian；ＧＧＬ）行列がＬＧＴを導出するために使用される。

例えば、重み付きグラフＧ（Ｗ，Ｖ）を所与として、ＧＧＬ行列が、Ｌ_ｃ＝Ｄ－Ｗ＋Ｖとして定義され得る。ここで、Ｗは、非負のエッジ重みｗｃで構成される隣接行列とすることができ、Ｄは、対角次数行列とすることができ、Ｖは、重み付き自己ループｖ_ｃ１、ｖ_ｃ２を示す対角行列とすることができる。行列Ｌ_ｃは：

として表されることができる。

そして、ＬＧＴを、ＧＧＬＬｃ：ＵΦＵ^Ｔの固有分解によって導出することができ、ここで、直交行列Ｕの列はＬＧＴの基底ベクトルであり、Φは対角固有値行列である。実際、ＤＣＴ－２、ＤＣＴ－８及びＤＳＴ－７を含め、離散コサイン変換（ＤＣＴ）及び離散サイン変換（ＤＳＴ）は、ある特定の形態のＧＧＬから導出されるＬＧＴである。ＤＣＴ－２は、ｖ_ｃ１＝０に設定することによって導出される。ＤＳＴ－７は、ｖ_ｃ１＝ｗ_ｃに設定することによって導出される。ＤＣＴ－８は、ｖ_ｃ２＝ｗ_ｃに設定することによって導出される。ＤＳＴ－４は、ｖ_ｃ１＝２ｗ_ｃに設定することによって導出される。ＤＣＴ－４は、ｖ_ｃ２＝２ｗ_ｃに設定することによって導出される。

ＬＧＴは、変換サイズ４、８、及び１６での行列乗法を用いて実装される。４点ＬＧＴコアは、Ｌ_ｃにおいてｖ_ｃ１＝２ｗ_ｃに設定することによって導出され、これは、それがＤＳＴ－４であることを意味する。８点ＬＧＴコアは、Ｌ_ｃにおいてｖ_ｃ１＝１．５ｗ_ｃに設定することによって導出され、１６点ＬＧＴコアは、Ｌ_ｃにおいてｖ_ｃ１＝ｗ_ｃに設定することによって導出され、これは、それがＤＳＴ－７であることを意味する。

ハイブリッド変換カーネルの拡張セットを、セットＡと称し得る。セットＡは、離散コサイン変換（ＤＣＴ）、アイデンティティ変換（ＩＤＴＸ、これは特定方向において変換コーディングをスキップする）、非対称（asymmetric）離散サイン変換（ＡＤＳＴ）、逆（flipped）非対称離散サイン変換（ＦＬＩＰＡＤＳＴ、これは逆順にＡＤＳＴを適用する）、線グラフ変換（ＬＧＴ）、逆（flipped）線グラフ変換（ＦＬＩＰＬＧＴ）、カヌーレン・レーベ変換（Karhunen-Loeve Transform；ＫＬＴ）などの全ての組み合わせを網羅的に含む。変換タイプの縮小セットとし得るものであるＡの要素のサブセットをｘと称することができ、それ故に、ｘ∈Ａである。サブセットｘは、１つ以上の変換タイプ（例えば、ＤＣＴ、ＡＤＳＴ、ＬＧＴ、ＫＬＴ）及び／又は垂直変換タイプと水平変換タイプとの１つ以上の組み合わせ（例えば、ＤＣＴ＿ＤＣＴ、ＬＧＴ＿ＬＧＴ、ＤＣＴ＿ＬＧＴ、ＬＧＴ＿ＤＣＴ）を含み得る。

１つ以上の実施形態によれば、エンコーダ及びデコーダの双方に利用可能なコーディングされた情報に基づいてハイブリッド変換タイプが選択され得るように、ｘの要素を選択するために黙示的な方法が使用され得る。従って、デコーダにおける変換タイプを指定するための追加のシグナリングは必要とされないとし得る。一実施形態において、この選択は、イントラ予測モード及び／又はブロックサイズに依存して行われ得る。一実施形態において、８つの公称モード、５つの非角度平滑モード、及び角度デルタ値（例えば、－３から＋３）のうちの１つ以上が選択プロセス中に考慮され得る。一実施形態において、方向イントラ予測モードに対しては、公称モードのみが、変換タイプを選択するのに用いられてもよい（すなわち、異なる角度デルタ値であるが同じ公称モードを共有する方向イントラ予測モードは、同じ黙示の変換タイプを適用し得る）。

一実施形態において、再帰フィルタリングモード及びＤＣモードでは、同じハイブリッド変換タイプを選択する。一実施形態において、再帰フィルタリングモード及びＳＭＯＯＴＨモードは、同じハイブリッド変換タイプを選択する。一実施形態において、ＳＭＯＯＴＨ、ＳＭＯＯＴＨ＿Ｈ、ＳＭＯＯＴＨ＿Ｖモードは、同じハイブリッド変換タイプを選択する。一実施形態において、ＳＭＯＯＴＨ、ＳＭＯＯＴＨ＿Ｈ、ＳＭＯＯＴＨ＿Ｖ及びＰａｅｔｈ予測モードは、同じハイブリッド変換タイプを選択する。一実施形態において、再帰フィルタリングモード、ＳＭＯＯＴＨ及びＰａｅｔｈ予測モードは、同じハイブリッド変換タイプを選択する。一実施形態において、垂直モード（Ｖ＿ＰＲＥＤ）及びＳＭＯＯＴＨ＿Ｖ予測モードは、同じハイブリッド変換タイプを選択する。一実施形態において、水平モード（Ｈ＿ＰＲＥＤ）及びＳＭＯＯＴＨ＿Ｈ予測モードは同じハイブリッド変換タイプを選択する。一実施形態において、ＣｆＬモード及びＤＣモードは、同じハイブリッド変換タイプを選択する。一実施形態において、ＣｆＬモード及びＳＭＯＯＴＨモードは、同じハイブリッド変換タイプを選択する。一実施形態において、ＣｆＬモード及びＰａｅｔｈモードは、同じハイブリッド変換タイプを選択する。

一実施形態において、８つの公称モード、５つの非角度平滑モード、及び角度デルタ値（例えば、－３から＋３）、並びにブロックサイズのうちの１つ以上に依存して、異なる自己ループ重み（ｖ_ｃ１、ｖ_ｃ２）を有するＬＧＴが使用され得る。一実施形態において、８つの公称モード、５つの非角度平滑、及び角度デルタ値（例えば、－３から＋３）、並びにブロックサイズのうちの１つ以上に依存して、異なる統計特性を有するＫＬＴが使用され得る。一実施形態において、ルマ成分及びクロマ成分の両方に対して有効にされ得る同じイントラ予測モードに対して、黙示のハイブリッド変換選択は同じとし得る。

１つ以上の実施形態によれば、ビットストリーム内でシグナリングされるシンタックスによって選択が特定される必要があり得る（すなわち、エンコーダがブロックレベルで変換タイプを明示的に選択及びシグナリングする必要がある）ように、ｘの要素を選択するための明示的方法が提案され得る。ブロックレベルは、スーパーブロックレベル、コーディングブロックレベル、予測ブロックレベル、又は変換ブロックレベルを含み得る。一実施形態において、明示的な変換方式（少なくとも２つの変換タイプ候補）を、全てのイントラ予測モードに適用することができるが、ハイブリッド変換候補の数は、異なるイントラ予測モードに対して異なることができる。他の一実施形態において、一部のイントラ予測モードでは、黙示的又は明示的のいずれかの変換方式を使用することができる一方で、他のイントラ予測モードは、黙示的な変換方式（利用可能な変換タイプが１つのみ）を適用する。一実施形態において、明示的な変換方式がＬＧＴの使用を伴うとき、ＬＧＴ候補を規定する自己ループ重みの識別子をブロックレベルでビットストリームにてシグナリングすることができ、該識別子は、関連する自己ループレート値のインデックス又は自己ループレート値のいずれかとすることができる。一実施形態において、明示的な変換方式がＫＬＴの使用を伴うとき、ＫＬＴカーネルの識別子をブロックレベルでビットストリームにてシグナリングすることができ、該識別子は、ＫＬＴのインデックス又はＫＬＴ行列要素値のいずれかとすることができる。

明示的な方法と黙示的な方法との間の切り換えは、ハイレベルシンタックス又はブロックレベルのいずれかで指し示されることができる。選択がＨＬＳで指し示され得る場合、それは、ビデオパラメータセット（ＶＰＳ）、シーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、スライスヘッダを含み得る。ブロックレベルで切り換えが指し示され得る場合、それはスーパーブロックレベル、コーディングブロックレベル、予測ブロックレベル、及び／又は変換ブロックレベルを含み得る。

次に図３を参照するに、映像データをコーディングするための方法３００のステップを示す動作フローチャートが示されている。一部の実装において、図３の１つ以上のプロセスブロックは、コンピュータ１０２（図１）及びサーバコンピュータ１１４（図１）によって実行され得る。一部の実装では、図３の１つ以上のプロセスブロックは、コンピュータ１０２及びサーバコンピュータ１１４とは別個の、又はそれらを含んだ、別の装置又は装置群によって実行されてもよい。

３０２にて、方法３００は、映像データを受信することを含む。

３０４にて、方法３００は、映像データに対応するハイブリッド変換カーネルのセットを特定することを含む。

３０６にて、方法３００は、ハイブリッド変換カーネルのセットの中から、明示的に又は黙示的に、のいずれかでハイブリッド変換カーネルのサブセットを選択することを含む。

３０８にて、方法３００は、選択されたハイブリッド変換カーネルのサブセットに基づいて映像データを復号することを含む。

理解され得ることには、図３は、単に１つの実装の例示を提供するものであり、異なる実施形態がどのように実装され得るかに関して如何なる限定も意味するものではない。図示された環境に対する数多くの変更が、設計及び実装要件に基づいて為され得る。

図４は、例示的な一実施形態に従った、図１に示したコンピュータの内部及び外部コンポーネントのブロック図４００である。理解されるべきことには、図４は、単に１つの実装の例示を提供するものであり、異なる実施形態が実装され得る環境に関して如何なる限定も意味するものではない。図示された環境に対する数多くの変更が、設計及び実装要件に基づいて為され得る。

コンピュータ１０２（図１）及びサーバコンピュータ１１４（図１）は、図４に示すそれぞれの内部コンポーネントのセット８００Ａ、Ｂ及び外部コンポーネントのセット９００Ａ、Ｂを含み得る。内部コンポーネントのセット８００の各々は、１つ以上のバス８２６上の、１つ以上のプロセッサ８２０、１つ以上のコンピュータ読み取り可能ＲＡＭ８２２、及び１つ以上のコンピュータ読み取り可能ＲＯＭ８２４と、１つ以上のオペレーティングシステム８２８と、１つ以上のコンピュータ読み取り可能な有形ストレージ装置８３０とを含んでいる。

プロセッサ８２０は、ハードウェア、ファームウェア、又はハードウェアとソフトウェアとの組み合わせで実装される。プロセッサ８２０は、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、加速処理ユニット（ＡＰＵ）、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、又は別のタイプの処理コンポーネントである。一部の実装において、プロセッサ８２０は、機能を実行するようにプログラムされることが可能な１つ以上のプロセッサを含む。バス８２６は、内部コンポーネント８００Ａ、Ｂ間の通信を可能にするコンポーネントを含む。

サーバコンピュータ１１４（図１）上の１つ以上のオペレーティングシステム８２８、ソフトウェアプログラム１０８（図１）、及び映像コーディングプログラム１１６（図１）は、それぞれのＲＡＭ８２２（典型的にキャッシュメモリを含む）のうちの１つ以上を介したそれぞれのプロセッサ８２０のうちの１つ以上による実行のために、それぞれのコンピュータ読み取り可能な有形ストレージ装置８３０のうちの１つ以上に格納される。図４に示す実施形態において、コンピュータ読み取り可能な有形ストレージ装置８３０の各々は、内部ハードドライブの磁気ディスクストレージ装置である。あるいは、コンピュータ読み取り可能な有形ストレージ装置８３０の各々は、例えばＲＯＭ８２４、ＥＰＲＯＭ、フラッシュメモリなどの半導体ストレージ装置、光ディスク、磁気光ディスク、ソリッドステートディスク、コンパクトディスク（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）、フロッピーディスク（登録商標）、カートリッジ、磁気テープ、及び／又は、コンピュータプログラム及びデジタル情報を格納することができる別タイプの非一時的コンピュータ読み取り可能有形ストレージ装置である。

内部コンポーネントの各セット８００Ａ、Ｂはまた、例えばＣＤ－ＲＯＭ、ＤＶＤ、メモリスティック、磁気テープ、磁気ディスク、光ディスク、又は半導体ストレージ装置などの、１つ以上のポータブルコンピュータ読み取り可能有形ストレージ装置９３６から読み出す及びそれに書き込むための、Ｒ／Ｗドライブ又はインタフェース８３２を含んでいる。例えばソフトウェアプログラム１０８（図１）及び映像コーディングプログラム１１６（図１）などのソフトウェアプログラムは、それぞれのポータブルコンピュータ読み取り可能有形ストレージ装置９３６のうちの１つ以上に格納され、それぞれのＲ／Ｗドライブ又はインタフェース８３２を介して読み出され、そして、それぞれのハードドライブ８３０にロードされることができる。

内部コンポーネントの各セット８００Ａ、Ｂはまた、例えばＴＣＰ／ＩＰアダプタカード、無線Ｗｉ－Ｆｉインタフェースカード、又は３Ｇ、４Ｇ、若しくは５Ｇ無線インタフェースカード、又は他の有線若しくは無線通信リンクなどの、ネットワークアダプタ又はインタフェース８３６を含んでいる。サーバコンピュータ１１４（図１）上のソフトウェアプログラム１０８（図１）及び映像コーディングプログラム１１６（図１）は、ネットワーク（例えば、インターネット、ローカルエリアネットワーク又はその他、ワイドエリアネットワーク）及びそれぞれのネットワークアダプタ又はインタフェース８３６を介して、外部コンピュータからコンピュータ１０２（図１）及びサーバコンピュータ１１４にダウンロードされることができる。ネットワークアダプタ又はインタフェース８３６から、サーバコンピュータ１１４上のソフトウェアプログラム１０８及び映像コーディングプログラム１１６がそれぞれのハードドライブ８３０にロードされる。ネットワークは、銅線、光ファイバ、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイコンピュータ、及び／又はエッジサーバを有し得る。

外部コンポーネントのセット９００Ａ、Ｂの各々は、コンピュータディスプレイモニタ９２０、キーボード９３０、及びコンピュータマウス９３４を含むことができる。外部コンポーネント９００Ａ、Ｂはまた、タッチスクリーン、仮想キーボード、タッチパッド、ポインティング装置、及び他のヒューマンインタフェース装置を含むことができる。内部コンポーネントのセット８００Ａ、Ｂの各々はまた、コンピュータディスプレイモニタ９２０、キーボード９３０、及びコンピュータマウス９３４にインタフェースするためのデバイスドライバ８４０も含む。デバイスドライバ８４０、Ｒ／Ｗドライブ又はインタフェース８３２、及びネットワークアダプタ又はインタフェース８３６は、ハードウェア及び（ストレージ装置８３０及び／又はＲＯＭ８２４に格納された）ソフトウェアを有する。

予め理解されることには、この開示はクラウドコンピューティングに関する詳細な説明を含むが、ここに記載される教示の実装はクラウドコンピューティング環境に限定されるものではない。むしろ、一部の実施形態は、現在知られている又は後に開発される任意の他のタイプのコンピューティング環境と共に実装されることが可能である。

クラウドコンピューティングは、コンフィギュラブルなコンピューティングリソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、及びサービス）の共有プールへの簡便でオンデマンドなネットワークアクセスを可能にするためのサービス提供の一モデルであり、該共有プールは、最小限の、管理努力又はサービスプロバイダとのやりとりで、迅速に、使えるようにされる及び解放されることができる。このクラウドモデルは、少なくとも５つの特性、少なくとも３つのサービスモデル、及び少なくとも４つの展開モデルを含み得る。

特徴は以下の通りである：
オンデマンドセルフサービス：クラウド利用者は、サービスプロバイダとの人的やりとりを必要とせずに、一方的に、例えばサーバ時間及びネットワークストレージなどのコンピューティング能力を必要なままに自動的に使えるようにすることができる；
ブロードネットワークアクセス：機能は、ネットワーク上で利用可能であり、異種のシン・クライアント又はシック・クライアントプラットフォーム（例えば、携帯電話、ラップトップ、及びＰＤＡ）による使用を促進する標準機構を通じてアクセスされる；
リソースプーリング：プロバイダのコンピューティングリソースは、マルチテナントモデルを使用して複数の利用者にサービス提供するためにプールされ、異なる物理リソース及び仮想リソースが、要求に従って動的に割り当てられ、そして割り当て直される。利用者は一般に、より高いレベルの抽象化（例えば、国、州、又はデータセンタ）で位置を指定することができ得るが、提供されるリソースの正確な位置についての制御又は知識を持たないという点で、位置独立という感覚がある；
迅速な順応性：機能は、迅速にスケールアウトするように、一部ケースでは自動的に、迅速且つ弾力的に使えるようにされることができ、そして、迅速にスケールインするように迅速に解放されることができる。利用者にとって、プロビジョニングに利用可能な能力はしばしば無制限であるように見え、いつでもどんな量でも購入することができる；
測定されるサービス：クラウドシステムは、サービスのタイプ（例えば、ストレージ、処理、帯域幅、及びアクティブなユーザアカウント）に適したレベルの抽象化で計測機能を利用することにより、自動的にリソース利用を制御及び最適化する。リソースの使用をモニタし、制御し、報告して、利用されるサービスのプロバイダ及び利用者の双方に透明性を提供することができる。

サービスモデルは以下の通りである：
ソフトウェア・アズ・ア・サービス（ＳａａＳ）：利用者に提供される機能は、クラウドインフラストラクチャ上で走るプロバイダのアプリケーションを使用することである。アプリケーションは、例えばウェブブラウザなどのシン・クライアントインタフェース（例えば、ウェブベースの電子メール）を介して、様々なクライアント装置からアクセス可能である。利用者は、限られたユーザ固有のアプリケーションコンフィギュレーション設定を例外とし得るが、ネットワーク、サーバ、オペレーティングシステム、ストレージ、又は更には個々のアプリケーション機能を含め、基礎となるクラウドインフラストラクチャを管理したり制御したりはしない；
プラットフォーム・アズ・ア・サービス（ＰａａＳ）：利用者に提供される機能は、プロバイダによってサポートされるプログラミング言語及びツールを用いて作成された、利用者が作成又は取得したアプリケーションを、クラウドインフラストラクチャ上に展開することである。利用者は、展開したアプリケーション及び場合によりアプリケーションホスティング環境設定についての制御を有するが、ネットワーク、サーバ、オペレーティングシステム、又はストレージを含め、基礎となるクラウドインフラストラクチャを管理したり制御したりはしない；
インフラストラクチャ・アズ・ア・サービス（ＩａａＳ）：利用者に提供される機能は、オペレーティングシステム及びアプリケーションを含み得るものである任意のソフトウェアを利用者が展開して走らせることができる処理リソース、ストレージリソース、ネットワークリソース、及びその他の基本的なコンピューティングリソースを使えるようにすることである。利用者は、オペレーティングシステム、ストレージ、展開したアプリケーションについての制御、及び場合によりネットワークコンポーネント（例えば、ホストファイアウォール）を選択することについての限られた制御を有するが、基礎となるクラウドインフラストラクチャを管理したり制御したりはしない。

展開モデルは以下の通りである：
プライベートクラウド：クラウドインフラストラクチャが、ある組織のためだけに運用される。これは、その組織又は第三者によって管理されることができ、敷地内に存在してもよいし敷地外に存在してもよい；
コミュニティクラウド：クラウドインフラストラクチャが、幾つかの組織によって共有され、共通の関心事（例えば、ミッション、セキュリティ要求、ポリシー、及びコンプライアンス考慮）を持つ特定のコミュニティをサポートする。これは、それらの組織又は第三者によって管理されることができ、敷地内に存在してもよいし敷地外に存在してもよい；
パブリッククラウド：クラウドインフラストラクチャが、一般人又は大規模な業界団体に利用可能にされるとともに、クラウドサービスを販売する組織によって所有される；
ハイブリッドクラウド：クラウドインフラストラクチャが、２つ以上のクラウド（プライベート、コミュニティ、又はパブリック）を合成したものであり、それら２つ以上のクラウドは、固有のエンティティのままではあるが、データ及びアプリケーションの移植性（クラウド間での負荷バランシングのためのクラウドバースティングなど）を可能にする標準化技術又は独自技術によって共に結合される。

クラウドコンピューティング環境は、ステートレス性、疎結合性、モジュール性、及び意味論的相互運用性に焦点を当てたサービス指向のものである。クラウドコンピューティングの中心にあるのでは、相互接続されたノードのネットワークを有するインフラストラクチャである。

図５を参照するに、例示的なクラウドコンピューティング環境５００が示されている。図示のように、クラウドコンピューティング環境５００は、１つ以上のクラウドコンピューティングノード１０を有し、それを用いて、例えば携帯情報端末（ＰＤＡ）若しくは携帯電話５４Ａ、デスクトップコンピュータ５４Ｂ、ラップトップコンピュータ５４Ｃ、及び／又は自動車コンピュータシステム５４Ｎなどの、クラウド利用者によって使用されるローカルなコンピューティング装置が通信し得る。クラウドコンピューティングノード１０は互いに通信し得る。それらは、例えばここで上述したプライベート、コミュニティ、パブリック、若しくはハイブリッドクラウド、又はこれらの組み合わせなどの、１つ以上のネットワーク内で物理的又は仮想的にグループ化（図示せず）されてもよい。これは、クラウド利用者がローカルなコンピューティング装置上でリソースを維持管理する必要のないサービスとして、インフラストラクチャ、プラットフォーム、及び／又はソフトウェアをクラウドコンピューティング環境５００が提供することを可能にする。理解されることには、図４に示すコンピューティング装置５４Ａ－５４Ｎのタイプは単に例示であることを意図しており、クラウドコンピューティングノード１０及びクラウドコンピューティング環境５００は、任意のタイプのネットワーク及び／又はネットワークアドレッサブル接続（例えば、ウェブブラウザを使用する）上で任意のタイプのコンピュータ化装置と通信することができる。

図６を参照するに、クラウドコンピューティング環境５００（図５）によって提供される機能抽象化層のセット６００が示されている。予め理解されるべきことには、図６に示すコンポーネント、層、及び機能は単に例示であることを意図したものであり、実施形態はこれに限定されるものではない。図示のように、以下の層及び対応する機能が提供される。

ハードウェア及びソフトウェア層６０は、ハードウェア及びソフトウェアコンポーネントを含む。ハードウェアコンポーネントの例は、メインフレーム６１、ＲＩＳＣ（縮小命令セットコンピュータ）アーキテクチャベースのサーバ６２、サーバ６３、ブレードサーバ６４、ストレージ装置６５、並びにネットワーク及びネットワーキングコンポーネント６６を含む。一部の実施形態において、ソフトウェアコンポーネントは、ネットワークアプリケーションサーバソフトウェア６７及びデータベースソフトウェア６８を含む。

仮想化層７０は抽象化層を提供し、そこから、仮想エンティティの以下の例：仮想サーバ７１、仮想ストレージ７２、仮想プライベートネットワークを含む仮想ネットワーク７３、仮想アプリケーション及びオペレーティングシステム７４、並びに仮想クライアント７５が提供され得る。

一例において、管理層８０は、後述する機能を提供し得る。リソースプロビジョニング８１が、クラウドコンピューティング環境内でタスクを実行するのに利用されるコンピューティングリソース及び他のリソースの動的な調達を提供する。計測及び価格決定８２が、クラウドコンピューティング環境内でリソースが利用されるときのコスト追跡と、これらのリソースの消費に対する請求書作成又はインボイス作成とを提供する。一例において、これらのリソースは、アプリケーションソフトウェアライセンスを有し得る。セキュリティが、クラウド利用者及びタスクに対する身元確認と、データ及び他のリソースの保護とを提供する。ユーザポータル８３が、利用者及びシステム管理者に対してクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理８４が、要求されるサービスレベルが満たされるように、クラウドコンピューティングリソースの割り当て及び管理を提供する。サービス内容合意書（ＳＬＡ）立案及び充足８５が、ＳＬＡに従って、将来の要求が予測されるクラウドコンピューティングリソースの事前準備及び調達を提供する。

ワークロード層９０は、それらに対してクラウドコンピューティング環境が利用され得る機能の例を提供する。この層から提供され得るワークロード及び機能の例は、マッピング及びナビゲーション９１、ソフトウェア開発及びライフサイクル管理９２、仮想教室授業配信９３、データ分析処理９４、トランザクション処理９５、及び映像コーディング９６を含む。映像コーディング９６は、黙示的又は明示的にハイブリッド変換カーネルを選択することに基づいて映像データを符号化及び復号し得る。

一部の実施形態は、任意の可能な技術的詳細レベルのインテグレーションでのシステム、方法、及び／又はコンピュータ読み取り可能媒体に関し得る。コンピュータ読み取り可能媒体は、プロセッサに動作を実行させるためのコンピュータ読み取り可能プログラム命令を有するコンピュータ読み取り可能な非一時的記憶媒体（又は複数媒体）を含み得る。

コンピュータ読み取り可能記憶媒体は、命令実行装置による使用のために命令を保持及び格納することができる有形デバイスとすることができる。コンピュータ読み取り可能記憶媒体は、例えば、以下に限られないが、電子ストレージ装置、磁気ストレージ装置、光ストレージ装置、電磁ストレージ装置、半導体ストレージ装置、又はこれらの任意の好適な組み合わせとし得る。コンピュータ読み取り可能記憶媒体のいっそう具体的な例の非網羅的なリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラム可能読み出し専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリスティック、フロッピーディスク（登録商標）、命令を記録した例えばパンチカード若しくは溝内の隆起構造などの機械的に符号化されたデバイス、及びこれらの任意の好適な組み合わせを含む。コンピュータ読み取り可能記憶媒体は、ここで使用されるとき、例えば電波若しくは他の自由伝播する電磁波、導波路若しくは他の伝送媒体中を伝播する電磁波（例えば、光ファイバケーブル中を通る光パルス）、又はワイヤ中を伝送される電気信号などの、一時的な信号それ自体であると解釈されるものではない。

ここに記載されるコンピュータ読み取り可能プログラム命令は、コンピュータ読み取り可能記憶媒体からそれぞれのコンピューティング／プロセッシング装置にダウンロードされることができ、あるいは、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、及び／又は無線ネットワークといった、ネットワークを介して、外部コンピュータ又は外部ストレージ装置にダウンロードされることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイコンピュータ、及び／又はエッジサーバを有し得る。各コンピューティング／プロセッシング装置内のネットワークアダプタカード又はネットワークインタフェースが、ネットワークからコンピュータ読み取り可能プログラム命令を受信し、該コンピュータ読み取り可能プログラム命令を、それぞれのコンピューティング／プロセッシング装置内のコンピュータ読み取り可能記憶媒体に記憶するために転送する。

動作を実行するためのコンピュータ読み取り可能プログラムコード／命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用のコンフィグレーションデータ、又は例えばＳｍａｌｌｔａｌｋ、Ｃ＋＋、若しくはこれらに類するものなどのオブジェクト指向プログラミング言語、及び“Ｃ”プログラミング言語若しくは類似のプログラミング言語などの手続き型プログラミング言語を含め、１つ以上のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかとし得る。コンピュータ読み取り可能プログラム命令は、全体としてユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアローンのソフトウェアパッケージとして、部分的にユーザのコンピュータ上で且つ部分的に遠隔コンピュータ上で、又は完全に遠隔コンピュータ若しくはサーバ上で実行され得る。後者のシナリオにおいて、遠隔コンピュータは、ローカルエリアネットワーク（ＬＡＮ）又はワイドエリアネットワーク（ＷＡＮ）を含め、任意のタイプのネットワークを介してユーザのコンピュータに接続されることができ、あるいは、（例えば、インターネットサービスプロバイダを用いてインターネットを介して）外部コンピュータに対して接続が為されてもよい。一部の実施形態において、例えば、プログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又はプログラマブル論理アレイ（ＰＬＡ）を含む電子回路が、態様又は動作を実行するために、コンピュータ読み取り可能プログラム命令の状態情報を利用して当該電子回路をパーソナライズすることによって、コンピュータ読み取り可能プログラム命令を実行し得る。

これらのコンピュータ読み取り可能プログラム命令は、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサに提供されてマシンを生成することで、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサによって実行される命令が、フローチャート及び／又はブロック図の１つ以上のブロックに規定された機能／行為を実行するための手段を作り出すようにし得る。これらのコンピュータ読み取り可能プログラム命令はまた、特定の方法で機能するようにコンピュータ、プログラマブルデータ処理装置、及び／又は他の装置に指示することができるコンピュータ読み取り可能記憶媒体に格納されることで、命令を格納した該コンピュータ読み取り可能記憶媒体が、フローチャート及び／又はブロック図の１つ以上のブロックに規定された機能／行為の態様を実行する命令を含む製造物品を有するようにし得る。

コンピュータ読み取り可能プログラム命令はまた、コンピュータ、他のプログラマブルデータ処理装置、又は他の装置にロードされて、一連の動作ステップが該コンピュータ、他のプログラマブル装置、又は他の装置上で実行されてコンピュータ実装プロセスを生成することで、該コンピュータ、他のプログラマブル装置、又は他の装置上で実行される命令が、フローチャート及び／又はブロック図の１つ以上のブロックに規定された機能／行為を実行するようにし得る。

図におけるフローチャート及びブロック図は、様々な実施形態に従ったシステム、方法、及びコンピュータ読み取り可能媒体の取り得る実装のアーキテクチャ、機能、及び動作を示している。これに関し、フローチャート又はブロック図の各ブロックは、特定の（１つ以上の）論理機能を実装するための１つ以上の実行可能命令を有するモジュール、セグメント、又は命令部分を表し得る。当該方法、コンピュータシステム、及びコンピュータ読み取り可能媒体は、図に示したものに対して、追加のブロック、より少ないブロック、異なるブロック、又は異なるように構成されたブロックを含み得る。代わりの一部の実装では、ブロックにて言及された機能は、図で言及された順序とは順不同で行われてもよい。例えば、相次いで示された２つのブロックが実際には同時に又は実質的に同時に実行されてもよく、あるいは、関与する機能に応じて、ブロックが逆の順序で実行されてもよいことがある。これまた留意されたいことには、ブロック図及び／又はフローチャート図の各ブロック、並びにブロック図及び／又はフロー図のブロックの組み合わせは、規定された機能又は行為を実行する、あるいは専用ハードウェア及びコンピュータ命令の組み合わせを実行する、専用ハードウェアベースのシステムによって実装されることができる。

理解されることには、ここに記載されたシステム及び／又は方法は、様々な形態のハードウェア、ファームウェア、又はハードウェアとソフトウェアとの組み合わせにて実装され得る。これらのシステム及び／又は方法を実装するのに使用される実際の特殊化された制御ハードウェア又はソフトウェアコードは、実装を限定するものではない。従って、システム及び／又は方法の動作及び挙動は、特定のソフトウェアコードを参照することなくここに記載されており、理解されることには、ここでの説明に基づいてシステム及び／又は方法を実装するようにソフトウェア及びハードウェアが設計され得る。

ここで使用されるいずれの要素、行為、又は命令も、そのように明示的に記載されてい
ない限り、重要又は必須として解釈されるべきでない。また、ここで使用されるとき、冠詞“ａ”及び“ａｎ”は、１つ以上のアイテムを含むことを意図しており、“１つ以上”と相互に入れ替え可能に使用され得る。さらに、ここで使用されるとき、用語“セット”は、１つ以上のアイテム（例えば、関連したアイテム、関連しないアイテム、関連したアイテムと関連しないアイテムとの組み合わせなど）を含むことを意図しており、“１つ以上”と相互に入れ替え可能に使用され得る。１つのアイテムのみが意図される場合、用語“１つ”又は類似の言葉が使用される。また、ここで使用されるとき、用語“有する”、“持つ”、“持っている”、又はこれらに類するものは、オープンエンドの用語であることを意図している。さらに、“に基づく”というフレーズは、明示的に別段の断りがない限り、“少なくとも部分的に基づく”を意味することを意図している。

様々な態様及び実施形態のこれらの説明は、例示の目的で提示されており、網羅的であること又は開示された実施形態に限定されることを意図したものではない。特徴の組み合わせが請求項に記載され且つ／或いは明細書に開示されているとしても、それらの組み合わせは、取り得る実施の開示を限定することを意図したものではない。実際、これらの特徴の多くは、請求項に具体的に記載されていない及び／又は明細書に具体的に開示されていないやり方で組み合わせされ得る。以下に列記される各従属クレームは、直接的には１のクレームのみに従属していることがあるが、取り得る実装の開示は、各従属クレームを、クレームセット中の他の全てのクレームとの組み合わせで含む。説明した実施形態の範囲から逸脱することなく、数多くの変更及び変形が当業者に明らかになる。ここで使用された用語は、実施形態の原理、実際的な応用、又は市場で見出される技術に対する技術的改善を最もよく説明するため、又はここに開示された実施形態を当業者が理解することを可能にするために選択されたものである。

Claims

プロセッサが実行する、映像データをコーディングするための方法であって、
映像データを受信するステップと、
前記映像データに対応するハイブリッド変換カーネルのセットを特定するステップと、
ハイブリッド変換カーネルの前記セットの中からハイブリッド変換カーネルのサブセットを選択するステップと、
選択されたハイブリッド変換カーネルの前記サブセットに基づいて前記映像データを復号するステップと、
を有する方法。
ハイブリッド変換カーネルの前記サブセットは黙示的に選択される、請求項１に記載の方法。
ハイブリッド変換カーネルの前記サブセットは、受信した前記映像データに関連するイントラ予測モード及びブロックサイズのうちの少なくとも一方に基づいて選択される、請求項２に記載の方法。
前記イントラ予測モードは、ＤＣ、ＳＭＯＯＴＨ、ＳＭＯＯＴＨ＿Ｈ、ＳＭＯＯＴＨ＿Ｖ、Ｖ＿ＰＲＥＤ、Ｈ＿ＰＲＥＤ、ｃｈｒｏｍａ－ｆｒｏｍ－ｌｕｍａ、及びＰａｅｔｈのうちの１つ以上を有する、請求項３に記載の方法。
ハイブリッド変換カーネルの前記サブセットは明示的に選択される、請求項１に記載の方法。
ハイブリッド変換カーネルの前記サブセットは、前記映像データに関連するビットストリーム内でシグナリングされるシンタックス要素によって特定される、請求項５に記載の方法。
全てのイントラ予測モードに対して明示的な変換スキームが適用される、請求項５に記載の方法。
異なるイントラ予測モードではハイブリッド変換候補の数が異なる、請求項７に記載の方法。
イントラ予測モードのサブセットに対して明示的な変換スキームが使用される、請求項５に記載の方法。
ハイブリッド変換カーネルの前記サブセットは、ハイレベルシンタックスでの又はブロックレベルでのシグナリングに基づいて、明示的と黙示的との間で切り換えられる、請求項１に記載の方法。
コンピュータプログラムを格納した１つ以上のメモリと、
１つ以上のプロセッサと、
を有し、
前記コンピュータプログラムは、前記１つ以上のプロセッサに、請求項１乃至１０のいずれか一項に記載の方法を実行させる、
コンピュータシステム。
コンピュータに請求項１乃至１０のいずれか一項に記載の方法を実行させるコンピュータプログラム。