JP2024513939A - 重複ブロック動き補償 - Google Patents

重複ブロック動き補償 Download PDF

Info

Publication number
JP2024513939A
JP2024513939A JP2023562181A JP2023562181A JP2024513939A JP 2024513939 A JP2024513939 A JP 2024513939A JP 2023562181 A JP2023562181 A JP 2023562181A JP 2023562181 A JP2023562181 A JP 2023562181A JP 2024513939 A JP2024513939 A JP 2024513939A
Authority
JP
Japan
Prior art keywords
block
obmc
sub
blocks
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023562181A
Other languages
English (en)
Inventor
ロベール、アントワン
ギャルパン、フランク
プアリエ、タンジ
チェン、ヤ
Original Assignee
インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ filed Critical インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Publication of JP2024513939A publication Critical patent/JP2024513939A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/583Motion compensation with overlapping blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

重複ブロック動き補償(OBMC)を実施するためのシステム、方法、及び手段が開示される。OBMCは、動きフィールドが均一である場合、コーディングブロック内のサブブロックをブロック全体として考慮することによって実施され得る。OBMCは、ブロックベースのOBMC手法を使用して、複数のサブブロックに分割されたコーディングブロックに対して実施され得る。サブブロックは、ブロックに関連付けられたアフィンモデルが並進的である場合、同じ動きフィールドを有すると判定され得る。OBMCは、ブロックベースの手法を使用して、マージモードにおいて元のピクチャからOBMCを減算することによって実施され得る。OBMCモードでコーディングされたブロックは、動き補償、例えば、マージモードの高速マージパスにおいて使用され得る。ブロックの上側帯域及び左側帯域は、現在のブロックに関連付けられた入力信号から減算されてもよく、動き補償は、上側帯域及び左側帯域が減算されたブロックに対して実施されてもよい。

Description

関連出願の相互参照
本出願は、2021年4月12日に出願された欧州特許出願第21305480.2号の利益を主張するものであり、その開示は、全体が参照により本明細書に組み込まれる。
ビデオコーディングシステムは、デジタルビデオ信号を圧縮して、例えば、かかる信号に必要とされる記憶容量及び/又は送信帯域幅を低減するように使用され得る。
重複ブロック動き補償(overlapped block motion compensation、OBMC)を実施するためのシステム、方法、及び手段が開示される。OBMCは、動きフィールドが均一である場合、コーディングブロック内のサブブロックをブロック全体として考慮することによって実施され得る。例えば、OBMCは、ブロックベースのOBMC手法を使用して、複数のサブブロックに分割されたコーディングブロックに対して実施され得る。OBMCは、ブロックのサブブロックに対してまとめて実施され得る。例えば、OBMCは、ブロックがサブブロックに分割されていないかのように、サブブロックを全体として考慮することによって実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが同じ動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが実質的に同じ動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが類似の動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックが類似の動きフィールドに関連付けられているかどうかについての判定は、例えば、動きフィールドに関連付けられた差分絶対値和に基づいて実施され得る。例えば、サブブロックの動きフィールドに関連付けられた差分絶対値和が閾値を下回る場合、動きフィールドが類似していると判定され得る。
例えば、サブブロックが同じ動きフィールドに関連付けられているかどうかは、ブロックに関連付けられたアフィンモデルに基づき得る。サブブロックは、ブロックに関連付けられたアフィンモデルが並進的である場合、同じ動きフィールドを有すると判定され得る。
OBMCは、例えば、ブロックベースの手法を使用して、マージモードにおいて元のピクチャから減算され得る。OBMCは、マージモードで実施され得る。OBMCを用いてコーディングされたブロックは、動き補償、例えば、マージモードの高速マージパスにおいて使用され得る。ブロックの上側帯域及び左側帯域は、現在のブロックに関連付けられた入力信号から減算されてもよく、動き補償は、上側帯域及び左側帯域が減算されたブロックに対して実施されてもよい。
本明細書で説明されるシステム、方法、及び手段は、デコーダを伴い得る。いくつかの例では、本明細書で説明するシステム、方法、及び手段は、エンコーダを伴い得る。いくつかの例では、本明細書で説明するシステム、方法、及び手段は、(例えば、エンコーダからの、及び/又はデコーダによって受信された)信号を伴い得る。コンピュータ可読媒体は、1つ以上のプロセッサに、本明細書で説明する方法を実施させるための命令を含み得る。命令を含み得るコンピュータプログラム製品であって、命令は、プログラムが1つ以上のプロセッサによって実行されるときに、1つ以上のプロセッサに、本明細書に記載の方法を行わせ得る、コンピュータプログラム製品。
1つ以上の開示された実施形態が実装され得る、例示的な通信システムを例解するシステム図である。 一実施形態による、図1Aに例解される通信システム内で使用され得る、例示的な無線送/受信ユニット(WTRU)を例解するシステム図である。 一実施形態による、図1Aに例解される通信システム内で使用され得る、例示的な無線アクセスネットワーク(RAN)及び例示的なコアネットワーク(core network、CN)を例解するシステム図である。 一実施形態による、図1Aに例解される通信システム内で使用され得る、更なる例示的なRAN及び更なる例示的なCNを例解するシステム図である。 例示的なビデオエンコーダを例解する。 例示的なビデオデコーダを例解する。 様々な態様及び実施例が実装され得るシステムの実施例を例解する。 圧縮ピクチャを表すための例示的なコーディングツリーユニット(Coding Tree Unit、CTU)及びコーディングツリー(Coding Tree、CT)を例解する。 コーディングツリーユニットのコーディングユニット、予測ユニット、及び変換ユニットへの例示的な分割を例解する。 重複ブロック動き補償(OBMC)の実施例を例解する。
より詳細な理解は、例示として添付の図面と併せて与えられる、以下の詳細な説明から得られ得る。
図1Aは、1つ以上の開示された実施形態が実装され得る、例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージ伝達、ブロードキャストなどのコンテンツを、複数の無線ユーザに提供する、多重アクセスシステムであり得る。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じて、上記のようなコンテンツにアクセスすることを可能にし得る。例えば、通信システム100は、コード分割多重アクセス(code division multiple access、CDMA)、時分割多重アクセス(time division multiple access、TDMA)、周波数分割多重アクセス(frequency division multiple access、FDMA)、直交FDMA(orthogonal FDMA、OFDMA)、シングルキャリアFDMA(single-carrier FDMA、SC-FDMA)、ゼロテールユニークワードDFT-Spread OFDM(zero-tail unique-word DFT-Spread OFDM、ZT UW DTS-s OFDM)、ユニークワードOFDM(unique word OFDM、UW-OFDM)、リソースブロックフィルタ処理OFDM、フィルタバンクマルチキャリア(filter bank multicarrier、FBMC)などの、1つ以上のチャネルアクセス方法を用い得る。
図1Aに示されるように、通信システム100は、無線送信/受信ユニット(WTRU)102a、102b、102c、102dと、RAN104/113と、CN106/115と、公衆交換電話網(public switched telephone network、PSTN)108と、インターネット110と、他のネットワーク112とを含み得るが、開示される実施形態は、任意の数のWTRU、基地局、ネットワーク、及び/又はネットワーク要素を企図していることが理解されよう。WTRU102a、102b、102c、102dの各々は、無線環境において動作し、かつ/又は通信するように構成された、任意のタイプのデバイスであり得る。例として、それらのいずれも「局」及び/又は「STA」と称され得るWTRU102a、102b、102c、102dは、無線信号を送信及び/又は受信するように構成され得、ユーザ機器(user equipment、UE)、移動局、固定又は移動加入者ユニット、加入ベースのユニット、ページャ、セルラ電話、携帯情報端末(personal digital assistant、PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、無線センサ、ホットスポット又はMi-Fiデバイス、モノのインターネット(Internet of Things、IoT)デバイス、ウォッチ又は他のウェアラブル、ヘッドマウントディスプレイ(head-mounted display、HMD)、車両、ドローン、医療デバイス及びアプリケーション(例えば、遠隔手術)、工業用デバイス及びアプリケーション(例えば、工業用及び/又は自動処理チェーンコンテキストで動作するロボット及び/又は他の無線デバイス)、家電デバイス、商業用及び/又は工業用無線ネットワークで動作するデバイスなどを含み得る。WTRU102a、102b、102c、及び102dのいずれも、互換的にUEと称され得る。
通信システム100はまた、基地局114a及び/又は基地局114bを含み得る。基地局114a、114bの各々は、CN106/115、インターネット110、及び/又は他のネットワーク112など、1つ以上の通信ネットワークへのアクセスを容易にするために、WTRU102a、102b、102c、102dのうちの少なくとも1つと無線でインターフェース接続するように構成された、任意のタイプのデバイスであり得る。例として、基地局114a、114bは、基地局トランシーバ(base transceiver station、BTS)、ノードB、eノードB、ホームノードB、ホームeノードB、gNB、NRノードB、サイトコントローラ、アクセスポイント(access point、AP)、無線ルータなどであり得る。基地局114a、114bは各々単一の要素として示されているが、基地局114a、114bは、任意の数の相互接続された基地局及び/又はネットワーク要素を含み得ることが理解されるであろう。
基地局114aは、基地局コントローラ(base station controller、BSC)、無線ネットワークコントローラ(radio network controller、RNC)、リレーノードなど、他の基地局及び/又はネットワーク要素(図示せず)も含み得る、RAN104/113の一部であり得る。基地局114a及び/又は基地局114bは、セル(図示せず)と称され得る、1つ以上のキャリア周波数で無線信号を送信及び/又は受信するように構成され得る。これらの周波数は、認可スペクトル、未認可スペクトル、又は認可及び未認可スペクトルの組み合わせであり得る。セルは、相対的に固定され得るか又は経時的に変化し得る特定の地理的エリアに、無線サービスのカバレッジを提供し得る。セルは、更にセルセクタに分けられ得る。例えば、基地局114aと関連付けられたセルは、3つのセクタに分けられ得る。したがって、一実施形態では、基地局114aは、3つのトランシーバを、すなわち、セルのセクタごとに1つのトランシーバを含み得る。一実施形態では、基地局114aは、多重入力多重出力(multiple-input multiple output、MIMO)技術を用い得、セルのセクタごとに複数のトランシーバを利用し得る。例えば、ビームフォーミングを使用して、所望の空間方向に信号を送信及び/又は受信し得る。
基地局114a、114bは、エアインターフェース116を介して、WTRU102a、102b、102c、102dのうちの1つ以上と通信し得るが、このエアインターフェース116は、任意の好適な無線通信リンク(例えば、無線周波数(radio frequency、RF)、マイクロ波、センチメートル波、マイクロメートル波、赤外線(infrared、IR)、紫外線(ultraviolet、UV)、可視光など)であり得る。エアインターフェース116は、任意の好適な無線アクセス技術(radio access technology、RAT)を使用して確立され得る。
より具体的には、上記のように、通信システム100は、多重アクセスシステムであり得、例えば、CDMA、TDMA、FDMA、OFDMA、SC-FDMAなどの、1つ以上のチャネルアクセススキームを用い得る。例えば、RAN104/113内の基地局114a、及びWTRU102a、102b、102cは、ユニバーサル移動体通信システム(Universal Mobile Telecommunications System、UMTS)地上無線アクセス(UMTS Terrestrial Radio Access、UTRA)などの無線技術を実装し得、これは広帯域CDMA(wideband CDMA、WCDMA)を使用してエアインターフェース115/116/117を確立し得る。WCDMAは、高速パケットアクセス(High-Speed Packet Access、HSPA)及び/又は進化型HSPA(HSPA+)などの通信プロトコルを含み得る。HSPAは、高速ダウンリンク(Downlink、DL)パケットアクセス(High-Speed Downlink Packet Access、HSDPA)及び/又は高速アップリンクパケットアクセス(High-Speed UL Packet Access、HSUPA)を含み得る。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、進化型UMTS地上無線アクセス(Evolved UMTS Terrestrial Radio Access、E-UTRA)などの無線技術を実装し得、これは、ロングタームエボリューション(Long Term Evolution、LTE)及び/又はLTE-Advanced(LTE-Advanced、LTE-A)及び/又はLTE-Advanced Pro(LTE-A Pro)を使用してエアインターフェース116を確立し得る。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、NR無線アクセスなどの無線技術を実装することができ、この技術は、新しい無線(New Radio、NR)を使用してエアインターフェース116を確立することができる。
一実施形態では、基地局114a及びWTRU102a、102b、102cは、複数の無線アクセス技術を実装し得る。例えば、基地局114a及びWTRU102a、102b、102cは、例えば、デュアルコネクティビティ(dual connectivity、DC)原理を使用して、LTE無線アクセス及びNR無線アクセスを一緒に実装し得る。したがって、WTRU102a、102b、102cによって利用されるエアインターフェースは、複数のタイプの無線アクセス技術、及び/又は複数のタイプの基地局(例えば、eNB及びgNB)に送られる/そこから送られる送信によって特徴付けられ得る。
他の実施形態では、基地局114a及びWTRU102a、102b、102cは、IEEE802.11(すなわち、無線フィデリティ(Wireless Fidelity、WiFi)、IEEE802.16(すなわち、ワイマックス(Worldwide Interoperability for Microwave Access、WiMAX)、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫定規格2000(IS-2000)、暫定規格95(IS-95)、暫定規格856(IS-856)、汎欧州デジタル移動電話方式(Global System for Mobile communications、GSM)、GSM進化型高速データレート(Enhanced Data rates for GSM Evolution、EDGE)、GSM EDGE(GERAN)などの無線技術を実装し得る。
図1Aの基地局114bは、例えば、無線ルータ、ホームノードB、ホームeノードB又はアクセスポイントであり得、事業所、家庭、車両、キャンパス、工業施設、(例えば、ドローンによる使用のための)空中回廊、道路などの場所などの局所的エリアにおける無線接続を容易にするために、任意の好適なRATを利用し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.11などの無線技術を実装して、無線ローカルエリアネットワーク(WLAN)を確立し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.15などの無線技術を実装して、無線パーソナルエリアネットワーク(wireless personal area network、WPAN)を確立し得る。更に別の一実施形態では、基地局114b及びWTRU102c、102dは、セルラベースのRAT(例えば、WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NRなど)を利用して、ピコセル又はフェムトセルを確立し得る。図1Aに示すように、基地局114bは、インターネット110への直接接続を有し得る。したがって、基地局114bは、CN106/115を介してインターネット110にアクセスする必要がない場合がある。
RAN104/113は、CN106/115と通信し得、これは、音声、データ、アプリケーション、及び/又はボイスオーバインターネットプロトコル(voice over internet protocol、VoIP)サービスをWTRU102a、102b、102c、102dのうちの1つ以上に提供するように構成された、任意のタイプのネットワークであり得る。データは、例えば、異なるスループット要件、レイテンシ要件、エラー許容要件、信頼性要件、データスループット要件、モビリティ要件などの、様々なサービス品質(quality of service、QoS)要件を有し得る。CN106/115は、呼制御、支払い請求サービス、移動体位置ベースのサービス、プリペイド呼、インターネット接続性、ビデオ配信などを提供し、かつ/又はユーザ認証などの高レベルセキュリティ機能を実施し得る。図1Aには示されていないが、RAN104/113及び/又はCN106/115は、RAN104/113と同じRAT又は異なるRATを採用する他のRANと、直接又は間接的に通信し得ることが理解されよう。例えば、NR無線技術を利用し得るRAN104/113に接続されていることに加えて、CN106/115はまた、GSM、UMTS、CDMA2000、WiMAX、E-UTRA、又はWiFi無線技術を採用して別のRAN(図示せず)と通信し得る。
CN106/115はまた、PSTN108、インターネット110、及び/又は他のネットワーク112にアクセスするために、WTRU102a、102b、102c、102dのためのゲートウェイとしての機能を果たし得る。PSTN108は、基本電話サービス(plain old telephone service、POTS)を提供する公衆交換電話網を含み得る。インターネット110は、相互接続されたコンピュータネットワーク及びデバイスのグローバルシステムを含み得るが、これらのネットワーク及びデバイスは、送信制御プロトコル(transmission control protocol、TCP)、ユーザデータグラムプロトコル(user datagram protocol、UDP)、及び/又はTCP/IPインターネットプロトコルスイートのインターネットプロトコル(internet protocol、IP)などの、共通通信プロトコルを使用する。ネットワーク112は、他のサービスプロバイダによって所有及び/又は運営される、有線及び/又は無線通信ネットワークを含み得る。例えば、ネットワーク112は、RAN104/113と同じRAT又は異なるRATを採用し得る、1つ以上のRANに接続された別のCNを含み得る。
通信システム100におけるWTRU102a、102b、102c、102dのいくつか又は全ては、マルチモード能力を含み得る(例えば、WTRU102a、102b、102c、102dは、異なる無線リンクを介して異なる無線ネットワークと通信するための複数のトランシーバを含み得る)。例えば、図1Aに示されるWTRU102cは、セルラベースの無線技術を用い得る基地局114a、及びIEEE802無線技術を用い得る基地局114bと通信するように構成され得る。
図1Bは、例示的なWTRU102を示すシステム図である。図1Bに示すように、WTRU102は、とりわけ、プロセッサ118、トランシーバ120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、非リムーバブルメモリ130、リムーバブルメモリ132、電源134、全地球測位システム(global positioning system、GPS)チップセット136、及び/又は他の周辺機器138を含み得る。WTRU102は、一実施形態との一貫性を有したまま、前述の要素の任意の部分的組み合わせを含み得ることが理解されよう。
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、複数のマイクロプロセッサ、DSPコアと関連付けられた1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array、FPGA)回路、任意の他のタイプの集積回路(integrated circuit、IC)、状態機械などであり得る。プロセッサ118は、信号コーディング、データ処理、電力制御、入力/出力処理、及び/又はWTRU102が無線環境で動作することを可能にする任意の他の機能性を実施し得る。プロセッサ118は、送信/受信要素122に結合され得るトランシーバ120に結合され得る。図1Bは、プロセッサ118及びトランシーバ120を別個のコンポーネントとして示すが、プロセッサ118及びトランシーバ120は、電子パッケージ又はチップにおいて一緒に統合され得るということが理解されよう。
送信/受信要素122は、エアインターフェース116を介して基地局(例えば、基地局114a)に信号を送信するか又は基地局(例えば、基地局114a)から信号を受信するように構成され得る。例えば、一実施形態では、送信/受信要素122は、RF信号を送信及び/又は受信するように構成されたアンテナであり得る。一実施形態では、送信/受信要素122は、例えば、IR、UV又は可視光信号を送信及び/又は受信するように構成されたエミッタ/検出器であり得る。更に別の実施形態では、送信/受信要素122は、RF信号及び光信号の両方を送信及び/又は受信するように構成され得る。送信/受信要素122は、無線信号の任意の組み合わせを送信及び/又は受信するように構成され得るということが理解されよう。
送信/受信要素122は、単一の要素として図1Bに示されているが、WTRU102は、任意の数の送信/受信要素122を含み得る。より具体的には、WTRU102は、MIMO技術を用い得る。したがって、一実施形態では、WTRU102は、エアインターフェース116を介して無線信号を送受信するための2つ以上の送信/受信要素122(例えば、複数のアンテナ)を含み得る。
トランシーバ120は、送信/受信要素122によって送信される信号を変調し、送信/受信要素122によって受信される信号を復調するように構成され得る。上記のように、WTRU102は、マルチモード能力を有し得る。したがって、トランシーバ120は、例えばNR及びIEEE802.11などの複数のRATを介してWTRU102が通信することを可能にするための複数のトランシーバを含み得る。
WTRU102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128(例えば、液晶ディスプレイ(liquid crystal display、LCD)表示ユニット若しくは有機発光ダイオード(organic light-emitting diode、OLED)表示ユニット)に結合され得、これらからユーザが入力したデータを受信し得る。プロセッサ118はまた、ユーザデータをスピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128に出力し得る。加えて、プロセッサ118は、非リムーバブルメモリ130及び/又はリムーバブルメモリ132などの任意のタイプの好適なメモリから情報にアクセスし、かつ当該メモリにデータを記憶し得る。非リムーバブルメモリ130は、ランダムアクセスメモリ(random-access memory、RAM)、読み取り専用メモリ(read-only memory、ROM)、ハードディスク又は任意の他のタイプのメモリ記憶デバイスを含み得る。リムーバブルメモリ132は、加入者識別モジュール(subscriber identity module、SIM)カード、メモリスティック、セキュアデジタル(secure digital、SD)メモリカードなどを含み得る。他の実施形態では、プロセッサ118は、サーバ又はホームコンピュータ(図示せず)上など、WTRU102上に物理的に配置されていないメモリから情報にアクセスし、かつ当該メモリにデータを記憶し得る。
プロセッサ118は、電源134から電力を受信し得るが、WTRU102における他のコンポーネントに電力を分配し、かつ/又は制御するように構成され得る。電源134は、WTRU102に電力を供給するための任意の好適なデバイスであり得る。例えば、電源134は、1つ以上の乾電池(例えば、ニッケルカドミウム(nickel-cadmium、NiCd)、ニッケル亜鉛(nickel-zinc、NiZn)、ニッケル金属水素化物(nickel metal hydride、NiMH)、リチウムイオン(lithium-ion、Li-ion)など)、太陽セル、燃料セルなどを含み得る。
プロセッサ118はまた、GPSチップセット136に結合され得、これは、WTRU102の現在の場所に関する場所情報(例えば、経度及び緯度)を提供するように構成され得る。GPSチップセット136からの情報に加えて又はその代わりに、WTRU102は、基地局(例えば、基地局114a、114b)からエアインターフェース116を介して場所情報を受信し、かつ/又は2つ以上の近くの基地局から受信されている信号のタイミングに基づいて、その場所を判定し得る。WTRU102は、一実施形態との一貫性を有したまま、任意の好適な位置判定方法によって位置情報を取得し得るということが理解されよう。
プロセッサ118は、他の周辺機器138に更に結合され得、他の周辺機器138には、追加の特徴、機能、及び/又は有線若しくは無線接続を提供する1つ以上のソフトウェア及び/又はハードウェアモジュールが含まれ得る。例えば、周辺機器138には、加速度計、電子コンパス、衛星トランシーバ、(写真及び/又はビデオのための)デジタルカメラ、ユニバーサルシリアルバス(universal serial bus、USB)ポート、振動デバイス、テレビトランシーバ、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(frequency modulated、FM)無線ユニット、デジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザ、仮想現実及び/又は拡張現実(Virtual Reality/Augmented Reality、VR/AR)デバイス、アクティビティトラッカなどが含まれ得る。周辺機器138は、1つ以上のセンサを含み得、センサは、ジャイロスコープ、加速度計、ホール効果センサ、磁力計、方位センサ、近接センサ、温度センサ、時間センサ、ジオロケーションセンサ、高度計、光センサ、タッチセンサ、磁力計、気圧計、ジェスチャセンサ、生体認証センサ、及び/又は湿度センサのうちの1つ以上であり得る。
WTRU102は、(例えば、UL(例えば、送信用)及びダウンリンク(例えば、受信用)の両方のための特定のサブフレームと関連付けられた)信号のいくつか又は全ての送信及び受信が並列及び/又は同時であり得る、全二重無線機を含み得る。全二重無線機は、ハードウェア(例えば、チョーク)又はプロセッサを介した信号処理(例えば、別個のプロセッサ(図示せず)又はプロセッサ118を介して)を介して自己干渉を低減し、かつ又は実質的に排除するための干渉管理ユニットを含み得る。一実施形態では、WRTU102は、(例えば、UL(例えば、送信用)又はダウンリンク(例えば、受信用)のいずれかのための特定のサブフレームと関連付けられた)信号のうちのいくつか又はすべてのうちのどれかの送信及び受信のための半二重無線機を含み得る。
図1Cは、一実施形態によるRAN104及びCN106を図示するシステム図である。上記のように、RAN104は、E-UTRA無線技術を用いて、エアインターフェース116を介してWTRU102a、102b、102cと通信し得る。RAN104はまた、CN106と通信し得る。
RAN104は、eノードB160a、160b、160cを含み得るが、RAN104は、一実施形態との一貫性を有しながら、任意の数のeノードBを含み得るということが理解されよう。eノードB160a、160b、160cは各々、エアインターフェース116を介してWTRU102a、102b、102cと通信するための1つ以上のトランシーバを含み得る。一実施形態では、eノードB160a、160b、160cは、MIMO技術を実装し得る。したがって、eノードB160aは、例えば、複数のアンテナを使用して、WTRU102aに無線信号を送信し、かつ/又はWTRU102aから無線信号を受信し得る。
eノードB160a、160b、160cの各々は、特定のセル(図示せず)と関連付けられ得、UL及び/又はDLにおいて、無線リソース管理決定、ハンドオーバ決定、ユーザのスケジューリングなどを処理するように構成され得る。図1Cに示すように、eノードB160a、160b、160cは、X2インターフェースを介して互いに通信し得る。
図1Cに示されるCN106は、モビリティ管理エンティティ(mobility management entity、MME)162、サービングゲートウェイ(serving gateway、SGW)164、及びパケットデータネットワーク(packet data network、PDN)ゲートウェイ(又はPGW)166を含み得る。前述の要素の各々は、CN106の一部として示されているが、これらの要素のいずれも、CNオペレータ以外のエンティティによって所有及び/又は操作され得ることが理解されよう。
MME162は、S1インターフェースを介して、RAN104におけるeノードB162a、162b、162cの各々に接続され得、かつ制御ノードとして機能し得る。例えば、MME162は、WTRU102a、102b、102cのユーザを認証すること、ベアラのアクティブ化/非アクティブ化、WTRU102a、102b、102cの初期アタッチ中に特定のサービングゲートウェイを選択すること、などの役割を果たし得る。MME162は、RAN104と、GSM及び/又はWCDMAなどの他の無線技術を採用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
SGW164は、S1インターフェースを介してRAN104におけるeノード-B160a、160b、160cの各々に接続され得る。SGW164は、概して、ユーザデータパケットをWTRU102a、102b、102cに/からルーティングし、転送し得る。SGW164は、eノード-B間ハンドオーバ中にユーザプレーンをアンカする機能、DLデータがWTRU102a、102b、102cに利用可能であるときにページングをトリガする機能、WTRU102a、102b、102cのコンテキストを管理及び記憶する機能などの、他の機能を実施し得る。
SGW164は、PGW166に接続され得、PGW166は、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。
CN106は、他のネットワークとの通信を容易にし得る。例えば、CN106は、WTRU102a、102b、102cと従来の地上回線通信デバイスとの間の通信を容易にするために、PSTN108などの回路交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。例えば、CN106は、CN106とPSTN108との間のインターフェースとして機能するIPゲートウェイ(例えば、IPマルチメディアサブシステム(IMS)サーバ)を含み得るか、又はそれと通信し得る。加えて、CN106は、WTRU102a、102b、102cに他のネットワーク112へのアクセスを提供し得、他のネットワーク112は、他のサービスプロバイダによって所有及び/又は動作される他の有線及び/又は無線ネットワークを含み得る。
WTRUは、無線端末として図1A~図1Dに記載されているが、特定の代表的な実施形態では、そのような端末は、通信ネットワークとの(例えば、一時的又は永久的に)有線通信インターフェースを使用し得ることが企図される。
代表的な実施形態では、他のネットワーク112は、WLANであり得る。
インフラストラクチャ基本サービスセット(Basic Service Set、BSS)モードのWLANは、BSSのアクセスポイント(AP)及びAPと関連付けられた1つ以上の局(STA)を有し得る。APは、配信システム(Distribution System、DS)若しくはBSSに入る、かつ/又はBSSから出るトラフィックを搬送する別のタイプの有線/無線ネットワークへのアクセス又はインターフェースを有し得る。BSS外から生じる、STAへのトラフィックは、APを通って到達し得、STAに配信され得る。STAからBSS外の宛先への生じるトラフィックは、APに送信されて、それぞれの宛先に送信され得る。BSS内のSTAどうしの間のトラフィックは、例えば、APを介して送信され得、ソースSTAは、APにトラフィックを送信し得、APは、トラフィックを宛先STAに配信し得。BSS内のSTA間のトラフィックは、ピアツーピアトラフィックとして考慮され、かつ/又は称され得る。ピアツーピアトラフィックは、ソースSTAと宛先STAとの間で(例えば、それらの間で直接的に)、直接リンクセットアップ(direct link setup、DLS)で送信され得る。特定の代表的な実施形態では、DLSは、802.11e DLS又は802.11zトンネル化DLS(tunneled DLS、TDLS)を使用し得る。独立BSS(Independent BSS、IBSS)モードを使用するWLANは、APを有しない場合があり、IBSS内又はそれを使用するSTA(例えば、STAの全て)は、互いに直接通信し得る。通信のIBSSモードは、本明細書では、「アドホック」通信モードと称され得る。
802.11acインフラストラクチャ動作モード又は同様の動作モードを使用するときに、APは、プライマリチャネルなどの固定チャネル上にビーコンを送信し得る。プライマリチャネルは、固定幅(例えば、20MHz幅の帯域幅)又はシグナリングを介して動的に設定される幅であり得る。プライマリチャネルは、BSSの動作チャネルであり得、APとの接続を確立するためにSTAによって使用され得る。特定の代表的な実施形態では、例えば、802.11システムにおいて、衝突回避を備えたキャリア感知多重アクセス(Carrier Sense Multiple Access/Collision Avoidance、CSMA/CA)が実装され得る。CSMA/CAの場合、APを含むSTA(例えば、全てのSTA)は、プライマリチャネルを感知し得る。プライマリチャネルが特定のSTAによってビジーであると感知され/検出され、かつ/又は判定される場合、特定のSTAはバックオフされ得る。1つのSTA(例えば、1つの局のみ)は、所与のBSSにおいて、任意の所与の時間に送信し得る。
高スループット(High Throughput、HT)STAは、通信のための40MHz幅のチャネルを使用し得るが、この40MHz幅のチャネルは、例えば、プライマリ20MHzチャネルと、隣接又は非隣接の20MHzチャネルとの組み合わせを介して形成され得る。
非常に高いスループット(Very High Throughput、VHT)のSTAは、20MHz、40MHz、80MHz、及び/又は160MHz幅のチャネルをサポートし得る。上記の40MHz及び/又は80MHz幅のチャネルは、連続する20MHzチャネルどうしを組み合わせることによって形成され得る。160MHzチャネルは、8つの連続する20MHzチャネルを組み合わせることによって、又は80+80構成と称され得る2つの連続していない80MHzチャネルを組み合わせることによって、形成され得る。80+80構成の場合、チャネル符号化後、データは、データを2つのストリームに分割し得るセグメントパーサを通過し得る。逆高速フーリエ変換(Inverse Fast Fourier Transform、IFFT)処理及び時間ドメイン処理は、各ストリームで別々に行われ得る。ストリームは、2つの80MHzチャネルにマッピングされ得、データは、送信STAによって送信され得る。受信STAの受信機では、80+80構成に対する上記で説明される動作は逆にされ得、組み合わされたデータを媒体アクセス制御(MAC)に送信し得る。
サブ1GHzの動作モードは、802.11af及び802.11ahによってサポートされる。チャネル動作帯域幅及びキャリアは、802.11n及び802.11acで使用されるものと比較して、802.11af及び802.11ahでは低減される。802.11afは、TVホワイトスペース(TV White Space、TVWS)スペクトルにおいて、5MHz、10MHz及び20MHz帯域幅をサポートし、802.11ahは、非TVWSスペクトルを使用して、1MHz、2MHz、4MHz、8MHz、及び16MHz帯域幅をサポートする。代表的な実施形態によれば、802.11ahは、マクロカバレッジエリア内のMTCデバイスなど、メータタイプの制御/マシンタイプ通信をサポートし得る。MTCデバイスは、例えば、特定の、かつ/又は限定された帯域幅のためのサポート(例えば、そのためのみのサポート)を含む、特定の能力を有し得る。MTCデバイスは、(例えば、非常に長いバッテリ寿命を維持するために)閾値を超えるバッテリ寿命を有するバッテリを含み得る。
複数のチャネル、並びに802.11n、802.11ac、802.11af、及び802.11ahなどのチャネル帯域幅をサポートし得るWLANシステムは、プライマリチャネルとして指定され得るチャネルを含む。プライマリチャネルは、BSSにおける全てのSTAによってサポートされる最大共通動作帯域幅に等しい帯域幅を有し得る。プライマリチャネルの帯域幅は、最小帯域幅動作モードをサポートするBSSで動作する全てのSTAの中から、STAによって設定され、かつ/又は制限され得る。802.11ahの例では、プライマリチャネルは、AP及びBSSにおける他のSTAが2MHz、4MHz、8MHz、16MHz、及び/又は他のチャネル帯域幅動作モードをサポートする場合であっても、1MHzモードをサポートする(例えば、それのみをサポートする)STA(例えば、MTCタイプデバイス)に対して1MHz幅であり得る。キャリア感知及び/又はネットワーク配分ベクトル(Network Allocation Vector、NAV)設定は、プライマリチャネルの状態に依存し得る。例えば、APに送信する(1MHz動作モードのみをサポートする)STAに起因してプライマリチャネルがビジーである場合、周波数帯域の大部分がアイドルのままであり、利用可能であり得るとしても、利用可能な周波数帯域全体がビジーであると考慮され得る。
米国では、802.11ahにより使用され得る利用可能な周波数帯域は、902MHz~928MHzである。韓国では、利用可能な周波数帯域は917.5MHz~923.5MHzである。日本では、利用可能な周波数帯域は916.5MHz~927.5MHzである。802.11ahに利用可能な総帯域幅は、国のコードに応じて6MHz~26MHzである。
図1Dは、ある実施形態によるRAN113及びCN115を例解するシステム図である。上記のように、RAN113は、NR無線技術を用いて、エアインターフェース116を介してWTRU102a、102b、102cと通信し得る。RAN113はまた、CN115と通信し得る。
RAN113は、gNB180a、180b、180cを含み得るが、RAN113は、一実施形態との一貫性を維持しながら、任意の数のgNBを含み得ることが理解されよう。gNB180a、180b、180cは各々、エアインターフェース116を介してWTRU102a、102b、102cと通信するための1つ以上のトランシーバを含み得る。一実施形態では、gNB180a、180b、180cは、MIMO技術を実装し得る。例えば、gNB180a、108bは、ビームフォーミングを利用して、gNB180a、180b、180cに信号を送信及び/又は受信し得る。したがって、gNB180aは、例えば、複数のアンテナを使用して、WTRU102aに無線信号を送信し、かつ/又はWTRU102aから無線信号を受信し得る。一実施形態では、gNB180a、180b、180cは、キャリアアグリゲーション技術を実装し得る。例えば、gNB180aは、複数のコンポーネントキャリアをWTRU102a(図示せず)に送信し得る。これらのコンポーネントキャリアのサブセットは、未認可スペクトル上にあり得、残りのコンポーネントキャリアは、認可スペクトル上にあり得る。一実施形態では、gNB180a、180b、180cは、協調マルチポイント(Coordinated Multi-Point、CoMP)技術を実装し得る。例えば、WTRU102aは、gNB180a及びgNB180b(及び/又はgNB180c)からの協調送信を受信し得る。
WTRU102a、102b、102cは、拡張可能なヌメロロジと関連付けられた送信を使用して、gNB180a、180b、180cと通信し得る。例えば、OFDMシンボル間隔及び/又はOFDMサブキャリア間隔は、無線送信スペクトルの異なる送信、異なるセル、及び/又は異なる部分に対して変化し得る。WTRU102a、102b、102cは、(例えば、様々な数のOFDMシンボルを含み、かつ/又は様々な長さの絶対時間が持続する)様々な又はスケーラブルな長さのサブフレーム又は送信時間間隔(transmission time interval、TTI)を使用して、gNB180a、180b、180cと通信し得る。
gNB180a、180b、180cは、スタンドアロン構成及び/又は非スタンドアロン構成でWTRU102a、102b、102cと通信するように構成され得る。スタンドアロン構成では、WTRU102a、102b、102cは、他のRAN(例えば、eノードB160a、160b、160cなど)にアクセスすることなく、gNB180a、180b、180cと通信し得る。スタンドアロン構成では、WTRU102a、102b、102cは、モビリティアンカポイントとしてgNB180a、180b、180cのうちの1つ以上を利用し得る。スタンドアロン構成では、WTRU102a、102b、102cは、未認可バンドにおける信号を使用して、gNB180a、180b、180cと通信し得る。非スタンドアロン構成では、WTRU102a、102b、102cは、gNB180a、180b、180cと通信し、これらに接続する一方で、eノードB160a、160b、160cなどの別のRANとも通信し、これらに接続し得る。例えば、WTRU102a、102b、102cは、1つ以上のgNB180a、180b、180c及び1つ以上のeノードB160a、160b、160cと実質的に同時に通信するためのDC原理を実装し得る。非スタンドアロン構成では、eノードB160a、160b、160cは、WTRU102a、102b、102cのモビリティアンカとして機能し得るが、gNB180a、180b、180cは、WTRU102a、102b、102cをサービス提供するための追加のカバレッジ及び/又はスループットを提供し得る。
gNB180a、180b、180cの各々は、特定のセル(図示せず)と関連付けられ得、無線リソース管理決定、ハンドオーバ決定、UL及び/又はDLにおけるユーザのスケジューリング、ネットワークスライシングのサポート、デュアルコネクティビティ、NRとE-UTRAとの間のインターワーキング、ユーザプレーン機能(User Plane Function、UPF)184a、184bへのユーザプレーンデータのルーティング、アクセス及びモビリティ管理機能(Access and Mobility Management Function、AMF)182a、182bへの制御プレーン情報のルーティングなどを処理するように構成され得る。図1Dに示すように、gNB180a、180b、180cは、Xnインターフェースを介して互いに通信し得る。
図1Dに示されるCN115は、少なくとも1つのAMF182a、182b、少なくとも1つのUPF184a、184b、少なくとも1つのセッション管理機能(Session Management Function、SMF)183a、183b、及び場合によってはデータネットワーク(Data Network、DN)185a、185bを含み得る。前述の要素の各々は、CN115の一部として示されているが、これらの要素のいずれも、CNオペレータ以外のエンティティによって所有及び/又は操作され得ることが理解されよう。
AMF182a、182bは、N2インターフェースを介してRAN113におけるgNB180a、180b、180cのうちの1つ以上に接続され得、制御ノードとして機能し得る。例えば、AMF182a、182bは、WTRU102a、102b、102cのユーザの認証、ネットワークスライシングのサポート(例えば、異なる要件を有する異なるPDUセッションの処理)、特定のSMF183a、183bの選択、登録エリアの管理、NASシグナリングの終了、モビリティ管理などの役割を果たすことができる。ネットワークスライスは、WTRU102a、102b、102cを利用しているサービスのタイプに基づいて、WTRU102a、102b、102cのCNサポートをカスタマイズするために、AMF182a、182bによって使用され得る。例えば、異なるネットワークスライスは、高信頼低遅延(ultra-reliable low latency、URLLC)アクセスに依存するサービス、高速大容量(enhanced massive mobile broadband、eMBB)アクセスに依存するサービス、マシンタイプ通信(machine type communication、MTC)アクセスのためのサービス、及び/又は同様のものなどの異なる使用事例のために確立され得る。AMF162は、RAN113と、LTE、LTE-A、LTE-A Pro及び/又はWiFiなどの非3GPPアクセス技術などの他の無線技術を採用する他のRAN(図示せず)との間で切り替えるための制御プレーン機能を提供し得る。
SMF183a、183bは、N11インターフェースを介して、CN115内のAMF182a、182bに接続され得る。SMF183a、183bはまた、N4インターフェースを介して、CN115内のUPF184a、184bに接続され得る。SMF183a、183bは、UPF184a、184bを選択及び制御し、UPF184a、184bを通るトラフィックのルーティングを構成し得る。SMF183a、183bは、UE IPアドレスを管理して割り当てること、PDUセッションを管理すること、ポリシー執行及びQoSを制御すること、ダウンリンクデータ通知を提供することなど、他の機能を実施し得る。PDUセッションタイプは、IPベース、非IPベース、イーサネットベースなどであり得る。
UPF184a、184bは、N3インターフェースを介して、RAN113内のgNB180a、180b、180cのうちの1つ以上に接続され得、これにより、WTRU102a、102b、102cとIP対応デバイスとの間の通信を容易にするために、インターネット110などのパケット交換ネットワークへのアクセスをWTRU102a、102b、102cに提供し得る。UPF184、184bは、パケットをルーティングして転送すること、ユーザプレーンポリシーを執行すること、マルチホームPDUセッションをサポートすること、ユーザプレーンQoSを処理すること、ダウンリンクパケットをバッファすること、モビリティアンカリングを提供することなど、他の機能を実施し得る。
CN115は、他のネットワークとの通信を容易にし得る。例えば、CN115は、CN115とPSTN108との間のインターフェースとして機能するIPゲートウェイ(例えば、IPマルチメディアサブシステム(IMS)サーバ)を含み得るか、又はそれと通信し得る。加えて、CN115は、WTRU102a、102b、102cに他のネットワーク112へのアクセスを提供し得、他のネットワーク112は、他のサービスプロバイダによって所有及び/又は動作される他の有線及び/又は無線ネットワークを含み得る。一実施形態では、WTRU102a、102b、102cは、UPF184a、184bへのN3インターフェース、及びUPF184a、184bとDN185a、185bとの間のN6インターフェースを介して、UPF184a、184bを通じてローカルデータネットワーク(DN)185a、185bに接続され得る。
図1A~図1D、及び図1A~図1Dの対応する説明から見て、WTRU102a~d、基地局114a~b、eノード-B160a~c、MME162、SGW164、PGW166、gNB180a~c、AMF182a~b、UPF184a~b、SMF183a~b、DN185a~b、及び/又は本明細書に記載される任意の他のデバイスのうちの1つ以上に関する、本明細書に記載される機能のうちの1つ以上又はすべては、1つ以上のエミュレーションデバイス(図示せず)によって実施され得る。エミュレーションデバイスは、本明細書に説明される機能の1つ以上又は全てをエミュレートするように構成された1つ以上のデバイスであり得る。例えば、エミュレーションデバイスを使用して、他のデバイスを試験し、かつ/又はネットワーク及び/若しくはWTRU機能をシミュレートし得る。
エミュレーションデバイスは、ラボ環境及び/又はオペレータネットワーク環境における他のデバイスの1つ以上の試験を実装するように設計され得る。例えば、1つ以上のエミュレーションデバイスは、通信ネットワーク内の他のデバイスを試験するために、有線及び/又は無線通信ネットワークの一部として完全に若しくは部分的に実装され、かつ/又は展開されている間、1つ以上若しくは全ての機能を実施し得る。1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として一時的に実装/展開されている間、1つ以上若しくは全ての機能を実施し得る。エミュレーションデバイスは、試験を目的として別のデバイスに直接結合され得、かつ/又は地上波無線通信を使用して試験を実施し得る。
1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として実装/展開されていない間、全てを含む1つ以上の機能を実施し得る。例えば、エミュレーションデバイスは、1つ以上のコンポーネントの試験を実装するために、試験実験室での試験シナリオ、並びに/又は展開されていない(例えば、試験用の)有線及び/若しくは無線通信ネットワークにおいて利用され得る。1つ以上のエミュレーションデバイスは、試験機器であり得る。RF回路(例えば、1つ以上のアンテナを含み得る)を介した直接RF結合及び/又は無線通信は、データを送信及び/又は受信するように、エミュレーションデバイスによって使用され得る。
本出願は、ツール、特徴、実施例、モデル、アプローチなどを含む様々な態様を記載している。これらの態様の多くは、具体的に記載され、少なくとも個々の特性を示すために、限定的であり得るように記載されることが多い。しかしながら、これは、説明を明確にすることを目的としており、それらの態様の適用又は範囲を限定するものではない。実際、異なる態様の全てが組み合わされ、交換されて、更なる態様を提供し得る。その上、態様は、同様に、先の出願に記載の態様と組み合わせられ、交換され得る。
本出願において記載及び企図される態様は、多くの異なる形態で実装され得る。本明細書に記載の図5~図7は、いくつかの実施例を提供し得るが、他の実施例も企図される。図5~図7の考察は、実装形態の範囲を限定するものではない。態様のうちの少なくとも1つは、概して、ビデオ符号化及び復号に関し、少なくとも1つの他の態様は、概して、生成又は符号化されたビットストリームを送信することに関する。これら及び他の態様は、方法、装置、記載の方法のうちのいずれかに従ってビデオデータを符号化又は復号するための命令を記憶したコンピュータ可読記憶媒体、及び/又は記載の方法のうちのいずれかに従って生成されたビットストリームを記憶したコンピュータ可読記憶媒体として実装され得る。
本出願では、「再構成された(reconstructed)」及び「復号された(decoded)」という用語は、交換可能に使用され得、「ピクセル(pixel)」及び「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施例において、例えば、「第1の復号(first decoding)」及び「第2の復号(second decoding)」などの要素、コンポーネント、ステップ、動作などを修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、この実施例では、第1の復号は、第2の復号の前に実施される必要はなく、例えば、第2の復号の前、第2の復号の間、又は第2の復号と重複する時間中に発生し得る。
本出願に記載の様々な方法及び他の態様は、図2及び図3に示すように、ビデオエンコーダ200及びデコーダ300のモジュール、例えば、復号モジュールを修正するために使用され得る。その上、本明細書で開示される主題は、例えば、標準又は推奨に記載されているかどうかにかかわらず、既存の又は将来開発されるかどうかにかかわらず、任意のタイプ、形式、又はバージョンのビデオコーディング、並びに任意のかかる標準及び推奨の拡張に適用され得る。別段の指示がない限り、又は技術的に除外されない限り、本出願に記載の態様は、個々に又は組み合わせて使用され得る。
本出願に記載の実施例では、ビット数、ビット深度など、様々な数値が使用される。これら及び他の特定の値は、例を説明するためのものであり、説明する態様は、これらの特定の値に限定されない。
図2は、例示的なビデオエンコーダを示す図である。例示的なエンコーダ200の変形例が企図されるが、エンコーダ200は、全ての予想される変形例を説明することなく、明確にする目的で以下に記載される。
符号化される前に、ビデオシーケンスは、符号化前処理(201)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実施する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経ることができる。メタデータは、その前処理と関連付けられ、ビットストリームに添付され得る。
エンコーダ200では、以下に記載のように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、分割され(202)、例えば、コーディングユニット(coding unit、CU)の単位で処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、イントラ予測(260)を実施する。インターモードでは、動き推定(275)及び動き補償(270)が実施される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(205)、例えば、予測モードフラグによってイントラ/インターの決定を示す。予測残差は、例えば、原画像ブロックから予測されたブロックを減算することによって(210)計算される。
その予測残差は、次いで、変換され(225)、量子化される(230)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピーコーディングされる(245)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接コーディングされる。
エンコーダは、符号化されたブロックを復号して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号するために逆量子化され(240)、逆変換される(250)。デコードされた予測残差と予測されたブロックとを組み合わせて(255)、画像ブロックが再構成される。ループ内フィルタ(265)は、例えば、符号化アーチファクトを低減するための非ブロック化/サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタリングを実施するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
図3は、ビデオデコーダの実施例を示す図である。例示的なデコーダ300では、ビットストリームは、以下に記載のように、デコーダ要素によって復号される。ビデオデコーダ300は、概して、図2に記載の符号化パスとは逆の復号パスを実施する。エンコーダ200も又、概して、ビデオデータを符号化することの一部としてビデオ復号を実施する。
特に、デコーダの入力は、ビデオビットストリームを含み、ビデオエンコーダ200によって生成され得る。ビットストリームは、最初に、変換係数、動きベクトル、及び他のエンコーディングされた情報を取得するために、エントロピー復号される(330)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号されたピクチャ分割情報に従ってピクチャを分割し得る(335)。変換係数は、予測残差を復号するために、逆量子化され(340)、逆変換される(350)。デコードされた予測残差と予測されたブロックとを組み合わせて(355)、画像ブロックが再構成される。予測されたブロックは、イントラ予測(360)から又は動き補償予測(すなわち、インター予測)(375)から取得され得る(370)。ループ内フィルタ(365)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(380)に記憶される。
復号されたピクチャは、復号後処理(385)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(201)において実施された再マッピングプロセスの逆を実施する逆再マッピングを更に経ることができる。復号後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用することができる。実施例では、復号された画像(例えば、復号後処理が使用される場合、ループ内フィルタ(365)の適用後及び/又は復号後処理(385)の後)は、ユーザへのレンダリングのためにディスプレイデバイスに送信され得る。
図4は、本明細書に記載の様々な態様及び実施例が実装され得るシステムの実施例を示す図である。システム400は、以下に記載の様々なコンポーネントを含むデバイスとして具体化され得、本明細書に記載の態様のうちの1つ以上を実施するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム400の要素は、単独で、又は組み合わせて、単一の集積回路(IC)、複数のIC、及び/又は別個のコンポーネントに具現化され得る。例えば、少なくとも1つの実施例では、システム400の処理及びエンコーダ/デコーダ要素は、複数のIC及び/又は別個のコンポーネントにわたって分散される。様々な実施例では、システム400は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通じて、1つ以上の他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施例では、システム400は、本明細書に記載の態様のうちの1つ以上を実装するように構成されている。
システム400は、例えば、本明細書に説明される様々な態様を実装するために、自身にロードされた命令を実行するように構成された少なくとも1つのプロセッサ410を含む。プロセッサ410は、埋め込みメモリ、入出力インターフェース、及び当該技術分野において知られている様々な他の回路を含むことができる。システム400は、少なくとも1つのメモリ420(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム400は、記憶デバイス440を含み、これは、不揮発性メモリ及び/又は揮発性メモリを含むことができ、これらのメモリとしては、電気的消去可能なプログラマブル読み出し専用メモリ(Electrically Erasable Programmable Read-Only Memory、EEPROM)、読み出し専用メモリ(ROM)、プログラマブル読み出し専用メモリ(Programmable Read-Only Memory、PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(Dynamic Random Access Memory、DRAM)、スタティックランダムアクセスメモリ(Static Random Access Memory、SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブが挙げられるが、これらに限定されない。記憶デバイス440は、非限定的な例として、内部記憶デバイス、付属記憶デバイス(取り外し可能及び取り外し不可能な記憶デバイスを含む)、及び/又はネットワークアクセス可能な記憶デバイスを含むことができる。
システム400は、例えば、エンコードされたビデオ又はデコードされたビデオを提供するためにデータを処理するように構成されたエンコーダ/デコーダモジュール430を含み、エンコーダ/デコーダモジュール430は、それ自身のプロセッサ及びメモリを含むことができる。エンコーダ/デコーダモジュール430は、符号化機能及び/又は復号機能を実施するためにデバイス内に含まれ得るモジュールを表す。既知であるように、デバイスは、符号化モジュール及び復号モジュールのうちの一方又は両方を含むことができる。加えて、エンコーダ/デコーダモジュール430は、システム400の個別の要素として実装され得るか、又は当業者に知られているように、ハードウェアとソフトウェアの組み合わせとしてプロセッサ410内に組み込まれ得る。
本明細書に記載の様々な態様を実施するためにプロセッサ410又はエンコーダ/デコーダ430にロードされるプログラムコードは、記憶デバイス440に記憶され、その後、プロセッサ410による実行のためにメモリ420上にロードされ得る。様々な実施例によれば、プロセッサ410、メモリ420、記憶デバイス440、及びエンコーダ/デコーダモジュール430のうちの1つ以上は、本明細書に記載のプロセスの実施中に様々なアイテムのうちの1つ以上を記憶することができる。かかる記憶されたアイテムは、これらに限定されないが、入力ビデオ、復号されたビデオ、又は復号されたビデオの一部分、ビットストリーム、マトリックス、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含むことができる。
いくつかの実施例では、プロセッサ410及び/又はエンコーダ/デコーダモジュール430の内部のメモリは、命令を記憶し、符号化又は復号中に必要な処理のための作業メモリを提供するために使用される。ただし、他の実施例では、処理デバイスの外部のメモリ(例えば、処理デバイスは、プロセッサ410又はエンコーダ/デコーダモジュール430のいずれかであり得る)が、これらの機能のうちの1つ以上のために使用される。外部メモリは、メモリ420及び/又は記憶デバイス440、例えば、ダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリであり得る。いくつかの実施例では、外部不揮発性フラッシュメモリが、例えば、テレビのオペレーティングシステムを記憶するために使用される。少なくとも1つの実施例では、RAMなどの高速外部ダイナミック揮発性メモリが、ビデオ符号化及び復号動作のためのワーキングメモリとして使用される。
システム400の要素への入力は、ブロック445に示されるように、様々な入力デバイスを通して提供され得る。かかる入力デバイスとしては、これらに限定されないが、(i)例えば、放送局によって地上波で送信されるRF信号を受信する無線周波数(radio frequency、RF)部分、(ii)コンポーネント(COMP)入力端子(又は一組のCOMP入力端子)、(iii)ユニバーサルシリアルバス(USB)入力端子、及び/又は(iv)高解像度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力端子が挙げられる。他の実施例には、図4には示されていないが、コンポジットビデオが含まれる。
様々な実施例では、ブロック445の入力デバイスは、当技術分野で知られているように、関連付けられたそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択すること(信号を選択すること、又は信号をある帯域の周波数に帯域制限することとも称される)、(ii)選択された信号をダウンコンバートすること、(iii)(例えば)ある特定の実施例ではチャネルと称され得る信号周波数帯域を選択するために、より狭い周波数帯域に再び帯域制限すること、(iv)ダウンコンバートされ帯域制限された信号を復調すること、(v)誤り訂正を実施すること、及び/又は(vi)所望のデータパケットストリームを選択するために逆多重化すること、に好適な要素と関連付けられ得る。様々な実施例のRF部分は、これらの機能を実施するための1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、及び多重分離器を含む。RF部分は、様々なこれらの機能を実施するチューナを含むことができ、例えば、受信した信号をより低い周波数(例えば、中間周波数又は近ベースバンド周波数)に又はベースバンドにダウンコンバートすることを含む。1つのセットトップボックスの実施例では、RF部分及びその関連付けられた入力処理要素は、有線(例えば、ケーブル)媒体によって送信されたRF信号を受信し、フィルタ処理、ダウンコンバート、及び所望の周波数帯域への再度のフィルタ処理によって周波数選択を実施する。様々な実施例は、上述の(及び他の)要素の順序を再配列し、これらの要素のいくつかを除去し、及び/又は他の要素を追加して、類似の機能又は異なる機能を実施する。要素を追加することは、例えば、増幅器及びアナログ-デジタル変換器を挿入するなど、既存の要素間に要素を挿入することを含み得る。様々な実施例では、RF部分は、アンテナを含む。
USB端子及び/又はHDMI端子は、システム400をUSB接続及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様、例えば、リードソロモン誤り訂正は、例えば、必要に応じて、個別の入力処理IC内又はプロセッサ410内に実装され得ることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、個別のインターフェースIC内又はプロセッサ410内に実装され得る。例えば、プロセッサ410、並びにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ430を含む様々な処理要素に、復調され、エラー訂正され、逆多重化されたストリームを提供して、出力デバイス上に提示するために必要に応じてデータストリームを処理する。
システム400の様々な要素は、一体型ハウジング内に提供され得る。一体型ハウジング内では、様々な要素が相互接続され、適切な接続配列425、例えば、Inter-IC(I2C)バス、配線、及びプリント回路基板を含む当該技術分野で知られている内部バスを使用して、それらの間でデータを送信し得る。
システム400は、通信チャネル460を介して他のデバイスとの通信を可能にする通信インターフェース450を含む。通信インターフェース450は、通信チャネル460によってデータを送信及び受信するように構成されたトランシーバを含むことができるが、これに限定されない。通信インターフェース450は、モデム又はネットワークカードを含むことができるが、これに限定されず、通信チャネル460は、例えば、有線及び/又は無線媒体内に実装され得る。
データは、様々な実施例において、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、the Institute of Electrical and Electronics Engineersを指す)などの無線ネットワークを使用して、システム400にストリーミングされるか、又は他の方法で提供される。これらの実施例のWi-Fi信号は、Wi-Fi通信用に適合された通信チャネル460及び通信インターフェース450を介して受信される。これらの実施例の通信チャネル460は、典型的には、ストリーミングアプリケーション及び他のオーバートップ通信を可能にするためにインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施例は、入力ブロック445のHDMI接続によってデータを提供するセットトップボックスを使用して、ストリーミングされたデータをシステム400に提供する。更に他の実施例は、入力ブロック445のRF接続を使用して、ストリーミングされたデータをシステム400に提供する。上記のように、様々な実施例は、非ストリーミング方式でデータを提供する。加えて、様々な実施例は、Wi-Fi以外の無線ネットワーク、例えば、セルラーネットワーク又はBluetooth(登録商標)ネットワークを使用する。
システム400は、ディスプレイ475、スピーカ485、及び他の周辺デバイス495を含む様々な出力デバイスに出力信号を提供することができる。様々な実施例のディスプレイ475は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(organic light-emitting diode、OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み式ディスプレイのうちの1つ以上を含む。ディスプレイ475は、テレビ、タブレット、ラップトップ、携帯電話(モバイルフォン)、又は他のデバイスのためのものであり得る。又、ディスプレイ475を、他の構成要素と統合することができ(例えば、スマートフォン内のように)、又は別個にする(例えば、ラップトップ用の外部モニタ)こともできる。他の周辺デバイス495は、様々な実施例において、スタンドアロンデジタルビデオディスク(又はデジタル多用途ディスク)(両方の用語についてDVD)、ディスクプレーヤ、ステレオシステム、及び/又は照明システムのうちの1つ以上を含む。様々な実施例は、システム400の出力に基づいて機能を提供する1つ以上の周辺デバイス495を使用する。例えば、ディスクプレーヤは、システム400の出力を再生する機能を実施する。
様々な実施例では、制御信号は、AV.Link、コンシューマエレクトロニクス制御(Consumer Electronics Control、CEC)、又はユーザ介入の有無を問わずデバイス間の制御を可能にする他の通信プロトコルなどのシグナリングを使用して、システム400とディスプレイ475、スピーカ485、又は他の周辺デバイス495との間で通信される。出力デバイスは、それぞれのインターフェース470、480、及び490を通じた専用接続を介してシステム400に通信可能に結合され得る。代替的に、出力デバイスは、通信インターフェース450を介し、通信チャネル460を使用して、システム400に接続され得る。ディスプレイ475及びスピーカ485は、例えば、テレビなどの電子デバイス内のシステム400の他のコンポーネントと単一のユニットに統合され得る。様々な実施例では、ディスプレイインターフェース470は、例えば、タイミングコントローラ(timing controller、TCon)チップなどのディスプレイドライバを含む。
ディスプレイ475及びスピーカ485は、代替的に、例えば、入力445のRF部分が個別のセットトップボックスの一部分である場合、他のコンポーネントのうちの1つ以上から分離され得る。ディスプレイ475及びスピーカ485が外部コンポーネントである様々な実施例では、出力信号は、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して提供され得る。
これらの実施例は、プロセッサ410によって、又はハードウェアによって、又はハードウェア及びソフトウェアの組み合わせによって実装されるコンピュータソフトウェアによって行われ得る。非限定的な実施例として、これらの実施例は、1つ以上の集積回路によって実装され得る。メモリ420は、技術環境に適切な任意のタイプであり得、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及びリムーバブルメモリなどの任意の適切なデータ記憶技術を使用して実装され得る。プロセッサ410は、技術環境に適切な任意のタイプのものであり得、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、専用コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含することができる。
様々な実装形態は、復号することを含む。本出願で使用する際、「復号」は、例えば、ディスプレイに好適な最終出力をもたらすために、受信した符号化されたシーケンスに対して実施されるプロセスの全て又は一部を包含することができる。様々な実施例では、かかるプロセスは、典型的には、デコーダによって実施されるプロセス、例えば、エントロピー復号、逆量子化、逆変換、及び差分復号のうちの1つ以上を含む。様々な例では、そのようなプロセスは、また、あるいは代替的に、例えば、コーディングブロックからサブブロックに関連付けられた動き情報を判定すること、OBMCを実施すること(例えば、ブロックベースの手法を使用して、複数のサブブロックに対してまとめてOBMCを実施すること)、サブブロックに関連付けられた動き情報が類似又は同じであるかどうかを判定すること(例えば、差分絶対値和及び/又はアフィン動きベクトル予測モードを使用して)、ブロックに関連付けられた入力信号からブロックの帯域(例えば、上側帯域及び/又は左側帯域)を減算すること、動き推定のために高速マージパスを実施することなど、本出願で説明する様々な実装形態のデコーダによって実施されるプロセスを含む。
更なる実施例として、一実施例では、「復号(decoding)」はエントロピー復号のみを指し、別の実施例では、「復号(decoding)」は、差分復号のみを指し、別の実施例では、「復号(decoding)」は、エントロピー復号及び差分復号の組み合わせを指す。「復号プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な復号プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを作り出すために入力ビデオシーケンスに対して実施されるプロセスの全て又は一部を包含することができる。様々な実施例では、かかるプロセスは、典型的には、エンコーダによって実施されるプロセス、例えば、分割、差動符号化、変換、量子化、及びエントロピー符号化のうちの1つ以上を含む。様々な例では、そのようなプロセスは、また、あるいは代替的に、例えば、コーディングブロックからサブブロックに関連付けられた動き情報を判定すること、OBMCを実施すること(例えば、ブロックベースの手法を使用して、複数のサブブロックに対してまとめてOBMCを実施すること)、サブブロックに関連付けられた動き情報が類似又は同じであるかどうかを判定すること(例えば、差分絶対値和及び/又はアフィン動きベクトル予測モードを使用して)、ブロックに関連付けられた入力信号からブロックの帯域(例えば、上側帯域及び/又は左側帯域)を減算すること、動き推定のために高速マージパスを実施することなど、本出願で説明する様々な実装形態のエンコーダによって実施されるプロセスを含む。
更なる実施例として、一実施例では、「符号化(encoding)」は、エントロピー符号化のみを指し、別の実施例では、「符号化(encoding)」は、差分符号化のみを指し、別の実施例では、「符号化(encoding)」は、差分符号化及びエントロピー符号化の組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すこと目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
本明細書で使用したようなシンタックス要素は、説明上の用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
本明細書に記載の実装形態及び態様は、例えば、方法又はプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装され得る。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。装置は、例えば、適切なハードウェア、ソフトウェア、及びファームウェアで実装され得る。本方法は、例えば、プロセッサで実装され得るが、プロセッサは、一般に処理デバイスを指し、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスが含まれる。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル/携帯情報端末(Personal Digital Assistant、「PDA」)などのデバイスなどの通信デバイスも含まれる。
「一実施例(one example)」若しくは「実施例(an example)」又は「一実装形態(one implementation)」若しくは「実装形態(an implementation)」、並びにそれらの他の変形例への言及は、実施例に関連して説明される特定の特徴、構造、特性などが少なくとも1つの実施例に含まれることを意味する。そのため、本出願全体を通して様々な場所に現れる「一実施例では(in one example)」若しくは「実施例では(in an example)」又は「一実装形態では(in one implementation)」若しくは「実装形態では(in an implementation)」という語句、並びに任意の他の変形例の出現は、必ずしも全てが同じ実施例を指すとは限らない。
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上を含むことができる。取得することは、受信すること、取り出すこと、構築すること、生成すること、及び/又は判定することを含み得る。
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信すること」は、一般には、例えば、情報を記憶する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
例えば、「A/B」、「A及び/又はB(A and/or B)」及び「A及びBのうちの少なくとも1つ(at least one of A and B)」の場合、次の「/」、「及び/又は(and/or)」、及び「のうちの少なくとも1つ(at least one of)」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることを理解されるべきである。更なる実施例として、「A、B、及び/又はC(A, B, and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A, B, and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
また、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。エンコーダ信号は、例えば、本明細書で説明するように、OBMCモードで符号化されたコーディングブロックを含み得る。このようにして、一例では、エンコーダ側とデコーダ側の両方で同じパラメータが使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。逆に、デコーダが既に特定のパラメータ並びに他のパラメータを有する場合、シグナリングを使用して、送信(暗黙的なシグナリング)することなく、単にデコーダが特定のパラメータを知り選択することを可能にし得る。任意の実際の機能の送信を回避することによって、様々な実施例においてビット節約が実現される。シグナリングは、様々な方法で達成され得ることが理解されるべきである。例えば、様々な実施例では、1つ以上のシンタックス要素、フラグなどを使用して、対応するデコーダに情報をシグナリングする。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
当業者には明らかであるように、実装形態は、例えば、記憶又は送信され得る情報を搬送するようにフォーマットされた様々な信号を生成し得る。情報は、例えば、方法を実施するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、信号は、記載の実施例のビットストリームを搬送するようにフォーマットされ得る。かかる信号は、例えば、(例えば、スペクトルの無線周波数部分を使用して)電磁波として、又はベースバンド信号としてフォーマットされ得る。フォーマットすることは、例えば、データストリームを符号化し、符号化されたデータストリームで搬送波を変調することを含み得る。信号が搬送する信号は、例えば、アナログ情報又はデジタル情報であり得る。信号は、知られているように、様々な異なる有線又は無線リンクによって送信され得る。信号は、プロセッサ可読媒体に記憶され得るか、又はプロセッサ可読媒体からアクセスされ得るか若しくは受信され得る。
多くの実施例が、本明細書に記載されている。実施例の特徴は、様々な特許請求のカテゴリ及びタイプにわたって単独で又は任意の組み合わせで提供され得る。更に、実施例は、本明細書に記載の特徴、デバイス、又は態様のうちの1つ以上を、単独で又は任意の組み合わせで、様々な特許請求のカテゴリ及びタイプにわたって含み得る。例えば、本明細書に記載の特徴は、本明細書に記載されるように生成された情報を含むビットストリーム又は信号に実装され得る。情報により、デコーダが、記載の実施形態のいずれかに従って、ビットストリーム、エンコーダ、ビットストリーム、及び/又はデコーダを復号することが可能になり得る。例えば、本明細書に記載の特徴は、ビットストリーム又は信号を作成及び/又は送信及び/又は受信及び/又は受信及び/又は復号することによって実装され得る。例えば、本明細書に記載の特徴が実装され得、方法、プロセス、装置、データを記憶する媒体、命令を記憶する媒体、又は信号。例えば、本明細書に記載の特徴は、TV、セットトップボックス、携帯電話、タブレット、又は復号を実施する他の電子デバイスによって実装され得る。TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイスは、結果として生じる画像(例えば、ビデオビットストリームの残差再構成からの画像)を(例えば、モニタ、スクリーン、又は他のタイプのディスプレイを使用して)表示し得る。TV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイスは、符号化された画像を含む信号を受信し、復号を実施し得る。
重複ブロック動き補償(OBMC)を実施するためのシステム、方法、及び手段が開示される。OBMCは、動きフィールドが均一である場合、サブブロックCUを全体CUとして考慮することによって実施され得る。例えば、OBMCは、ブロックベースのOBMC手法を使用して、複数のサブブロックに分割されたコーディングブロックに対して実施され得る。OBMCは、ブロックのサブブロックに対してまとめて実施され得る。例えば、OBMCは、ブロックがサブブロックに分割されていないかのように、サブブロックを全体として考慮することによって実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが同じ動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが実質的に同じ動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックに分割されたブロックにブロックベースのOBMCを適用することは、サブブロックが類似の動きフィールドに関連付けられているという判定に基づいて実施され得る。サブブロックが類似の動きフィールドに関連付けられているかどうかについての判定は、例えば、動きフィールドに関連付けられた差分絶対値和に基づいて実施され得る。例えば、サブブロックの動きフィールドに関連付けられた差分絶対値和がある値(例えば、閾値)を下回る場合、動きフィールドが類似していると判定され得る。例えば、サブブロックの参照ピクチャが同じである場合、及びサブブロックの動きフィールドに関連付けられた差分絶対値和がある値(例えば、閾値)を下回る場合、動きフィールドが類似していると判定され得る。例えば、サブブロックの参照ピクチャが時間的に近接している場合、及びサブブロックの動きフィールドに関連付けられた差分絶対値和がある値(例えば、閾値)を下回る場合、動きフィールドが類似していると判定され得る。
例えば、サブブロックが同じ動きフィールドに関連付けられているかどうかは、ブロックに関連付けられたアフィンモデルに基づき得る。サブブロックは、ブロックに関連付けられたアフィンモデルが並進である場合、同じ動きフィールドを有すると判定され得る。
OBMCは、例えば、ブロックベースの手法を使用して、マージモードにおいて元のピクチャから減算され得る。OBMCは、マージモードで実施され得る。OBMCモードでコーディングされたブロックは、動き補償、例えば、マージモードの高速マージパスにおいて使用され得る。ブロックの上側帯域及び左側帯域は、現在のブロックに関連付けられた入力信号から減算されてもよく、動き補償は、上側帯域及び左側帯域が減算されたブロックに対して実施されてもよい。
本明細書で説明されるシステム、方法、及び手段は、デコーダを伴い得る。いくつかの例では、本明細書で説明するシステム、方法、及び手段は、エンコーダを伴い得る。いくつかの例では、本明細書で説明するシステム、方法、及び手段は、(例えば、エンコーダからの、及び/又はデコーダによって受信された)信号を伴い得る。コンピュータ可読媒体は、1つ以上のプロセッサに、本明細書で説明する方法を実施させるための命令を含み得る。命令を含み得るコンピュータプログラム製品であって、命令は、プログラムが1つ以上のプロセッサによって実行されるときに、1つ以上のプロセッサに、本明細書に記載の方法を行わせ得る、コンピュータプログラム製品。
動き補償された時間予測が実施されてもよい。動き補償された時間予測は、ビデオの連続するピクチャ間に存在する冗長性を利用するために使用され得る。
動きベクトルは、予測ユニット(PU)に関連付けられ得る。コーディングツリーユニット(CTU)は、コーディングツリーによって表され得る。CTUは、圧縮ドメイン内のコーディングツリーによって表現され得る。図5は、圧縮ピクチャを表すための例示的なコーディングツリーユニット(Coding Tree Unit、CTU)及びコーディングツリー(Coding Tree、CT)を例解する。図5は、CTUの四分木分割を例解する。四分木分割のリーフは、コーディングユニット(CU)と呼ばれ得る。ブロックは、CUであり得るか、又はCUを含み得る。CUは、複数のサブCUに分割され得る。サブブロックは、サブCUであり得るか、又はサブCUを含み得る。
CUは、イントラ又はインター予測パラメータ、例えば、予測情報を与えられ得る。CUは、1つ以上の予測ユニット(PU)に空間的に分割され得る。PUは、予測情報を割り当てられ得る。図6は、コーディングユニット、予測ユニット、及び変換ユニットへのコーディングツリーユニットの例示的な分割を例解する。図6に例解するように、イントラコーディングモード又はインターコーディングモードは、CUレベルで割り当てられ得る。
動きベクトルは、PUに割り当てられ得る。例えば、(例えば、1つの)動きベクトルが(例えば、各)PUに割り当てられ得る。例えば、複数の動きベクトルがPUに割り当てられ得る。動きベクトルは、動き補償された時間予測のために使用され得る。例では、動きベクトルは、考慮されるPUの動き補償された時間予測のために使用され得る。
動きデータは、例えば、CUに割り当てられ(例えば、直接割り当てられ)得る。CUは、例えば、(例えば、各)サブCUについて計算された動きベクトルを用いて、サブCUに分割され得る。CU及びコーディングブロックは、本明細書では互換的に使用され得る。
重複ブロック動き補償(OBMC)が実施され得る。動き補償が実施されてもよく、例えば、その後にOBMCが続いてもよい。OBMCは、(例えば、コーディングモードにかかわらず)インター予測されたCUのために実施され得る。OBMCは、例えば、ブロッキングアーティファクトをもつデブロッキングフィルタと同様に、CU間の動き遷移を減衰させ得る。適用されるOBMC動作は、CUコーディングモードに依存し得る。第1のOBMCプロセスは、サブブロック(例えば、アフィン、SbTMVP、FRUCなど)に分割されるCUに対して実施され得る。第2のOBMCプロセスは、他のCU(例えば、サブブロックに分割されていないCU全体)に対して実施され得る。サブブロックに分割されたブロックのためのサブブロックベースのOBMCプロセスは、他のCUのためのブロックベースのOBMCプロセスとは異なり得る。
図7は、上側及び左側隣接ブロックを使用する、ブロックベースのOBMCのためのOBMCの一例を例解する。図7に例解するように、現在のブロックCは、現在のブロックの動きベクトルで動き補償されてもよい。例えば、現在のブロックCの左側4ピクセル幅帯域は、動き補償され得る。現在のブロックCの左側4ピクセル幅帯域は、左側ブロック隣接Lの動きベクトルを用いて動き補償され得、例えば、現在のブロックCの上側4ピクセル高さ帯域は、動き補償され得る。現在のブロックCの上側4ピクセル高さ帯域は、上側ブロック隣接T0及びT1の動きベクトルを使用して動き補償され得る。例えば、重み付け加算は、ブロックレベル又はピクセルレベルで実施され得る。重み付けされた和が、最終的な動き補償された現在のブロックを計算するために実施され得る。重み付け係数が使用されてもよい。重み付け係数は、隣接帯域のために使用され得る。隣接帯域のために使用される重み付け係数は、{1/4、1/8、1/16、1/32}であり得る。重み付け係数は、現在のブロックのピクセルのそれぞれの行又は列に対して使用され得る。ピクセルの現在のブロックのそれぞれの行又は列のために使用される重み付け係数は、{3/4、7/8、15/16、31/32}であり得る。隣接帯域に使用される重み付け係数は、{6/32,1/8,1/16,1/32}に変更され得る。現在のブロックのそれぞれのピクセルの行又は列のために使用される重み付け係数は、{26/32、7/8、15/16、31/32}に変更され得る。
式中、
はOBMC補償ブロック、Iは予測ブロック、Iは隣接動きベクトルで補償されたブロック、w1、w2は対応する重み付け係数である。
サブブロックに分割されるCUの場合、隣接帯域のピクセルの行又は列の数は、ブロックベースのOBMCと比較して低減され得る。例えば、サブブロックベースのOBMCでは、隣接帯域のピクセルの行又は列の数は、2又は3ピクセルに低減され得る。異なるサブブロック間の内部境界は、同じ方法で処理され得る。使用される重み付け係数は、帯域について{1/4、1/8、1/16}であり得、現在のブロックについて{3/4、7/8、15/16}であり得る。
OBMCプロセスは、マージモードのために考慮され得る。マージモードは、インター予測において使用され得る。マージモードプロセスは、動きベクトル予測子を指定することを含み得る。マージモードプロセスは、予測子のリストを構築することを含み得る。予測子のリストは、動きベクトルと、参照フレームリストのための参照フレームとを含み得る。エンコーダでは、マージモードプロセスは、動き補償後にSADに基づいて予測子をソートすることを含み得る。RDOは、最良の予測子を提供することができる。マージモードにおけるOBMCプロセスは、CU全体を考慮し得る。サブブロックに分割されたCUは、OBMC適用時にCU全体として考慮され得る。OBMCプロセスは、マージモードにかかわらず、全てのCUに対してRDO中に実施される。CUがCU全体である場合、OBMC全体が使用され得る。CUがサブブロックに分割される場合、サブブロックOBMCが使用され得る。サブブロックは、サブブロックの動きが同じ(例えば、同じ並進動きである)場合、CU全体として考慮され得る。
OBMCプロセスは、マージモードの高速マージパスにおいて考慮され得る。OBMCプロセスは、CU全体を使用するマージモードの高速マージパスにおいて考慮され得る。サブブロックに分割されたCUは、CU全体として考慮され得る。例えば、OBMCは、CU全体を使用してマージモードにおいて元のピクチャから減算され得る。例えば、サブブロックに分割されたCUは、サブブロック間の動きフィールドが均一である場合、CU全体として考慮され得る。
本明細書で説明されるシステム、方法、及び実装形態は、デコーダ及び/又はエンコーダに適用可能であり得る。
OBMCは、高度動きベクトル予測(AMVP)のために実施され得る。AMVPは、予測コードタイプであり得る。AMVPは、インター予測モードであり得る。AMVPモードは、符号化プロセスのために使用され得る。AMVPモードは、動き情報を指定し得る。AMVPモードは、例えば、参照フレームリストから、参照フレームのためのMVPのリストを構築することを含み得る。AMVPモードは、動き推定を含み得る。AMVPモードは、例えば、参照フレームリストのためのペアを定義するために、予測子を用いた単方向動き推定を含み得る。AMVPモードは、例えばペアを用いた、双方向動き推定を含み得る。AMVPモードは、RDOに基づいて単方向又は双方向動き推定を使用してもよい。RDOは、動きベクトル差分(MVD)を定義し得る。AMVPは、参照フレームリストのための信号を含み得る。
AMVPモードは、復号プロセスのために使用され得る。AMVPモードは、例えば、参照フレームリストのための復号を含み得る。参照フレームリストの場合、AMVPモードは、MVPのリストを構築することを含み得る。AMVPモードは、CUを再構築することを含み得る。
AMVPモードは、アフィンモードを含み得る。アフィンAMVPモードは、アフィンモデルを判定することを含み得る。アフィンAMVPモードは、コーナー動きベクトル、例えば、2つ又は3つのコーナー動きベクトルを使用してアフィンモデルを判定することができる。アフィンAMVPモードは、CUの各ポイントにおける動きを定義することを可能にし得る。アフィンAMVPモードでは、アフィンモデルが継承され得る。例えば、アフィンモデルは、アフィンコーディングされた隣接CUから継承され得る。アフィンAMVPモードは、並進動きベクトルをアフィンモデル制御点動きベクトル(CPMV)として組み合わせることができる。
AMVPモードでは、OBMCは、例えば、通常の動き推定プロセスが適用される前に、現在のCUの元の信号を補償するために使用され得る。例えば、左側帯域及び上側帯域は、対応する重み付け係数{1/4,1/8,1/16,1/32}又は{6/32,1/8,1/16,1/32}を使用して、現在のCUの元の信号から減算され得る。
式中、Iは、OBMC補償ブロック
が最も近くなり得る元のブロックである。次に、最良予測ブロックIは、対応する重み付け係数を使用してOBMC隣接帯域Iが減算された元のブロックIに最も近いものになる。
OBMCは、(例えば、全体の)CUマージモードのために使用され得る。AMVPモードについて本明細書で説明されるOBMC減算は、(例えば、効率を改善するために)使用され得る。
高速マージパスは、例えば、フルRDO選択の前に、マージ符号化モードにおいて実施され得る。高速マージパスは、例えば、予測されたCUと現在のCUとの間の差分絶対値和(SAD)計算に基づいて、予測子のサブセットを選択することを可能にし得る。現在のCUとの最小のSADを保持する予測子は、OBMCプロセスを統合するフルRDO選択においてテストされる予測子であり得る。
OBMCは、SAD計算のための予測されたCUを構築すると考慮され得る。OBMCプロセスが全ての入力予測子に適用される場合、複雑さが増大し得る。OBMCが高速マージパスにおいて考慮されるように、現在のCUの元の信号から左側帯域及び上側帯域を1回減算することは、複雑さの影響を制限できる可能性がある。左側及び上側帯域に適用される重み付け係数は、{6/32、1/8、1/16、1/32}又は{1/4、1/8、1/16、1/32}であり得る。
高速マージパスにおいてOBMCが考慮されるように、現在のCUの元の信号から左側帯域及び上側帯域を一度減算することは、CU全体を扱うマージモード(例えば、デコーダ側動きベクトルリファインメント(DMVR)又はBDMVRを伴わない通常のマージモード、動きベクトル差分(MMVD)を伴うマージモード、イントラインター予測(CIIP)及びジオメトリ適応ブロック分割(GEO)モードの組み合わせ)に適用され得る。サブブロックマージモード(例えば、DMVR又はBDMVRを伴う通常マージモード、アフィン、サブブロックベースの時間動きベクトル予測(SbTMVP)及びテンプレートマージモード)の場合、OBMCプロセスはサブブロックモードを使用し得る。
OBMCは、例えば、局所照明補償(LIC)を使用するCUに対して、無効化され得る。LICは、予測子に固有のパラメータであり得る。現在のCUの元の信号の複数(例えば、2つ)のバージョンが記憶され得る。複数(例えば、2つ)のバージョンは、OBMCを伴わないものと、OBMC減算を伴うものとを含み得る。高速マージパスにおいてSADを計算する際に、テストされた予測子がLICを使用する場合、現在のCUは元の信号として定義され得る。テストされた予測子がLICを使用しない場合、現在のCUは、OBMC減算を伴う元の信号として定義され得る。
OBMCは、サブブロック分割されたCUのために使用され得る。並進モデルは、ブロック中のサブブロックが同じ動きベクトルを有することを示し得る。アフィンAMVPモードでは、アフィンモデルは並進的であり得る。アフィンモデルから継承することができるアフィンマージモードでは、アフィンモデルは並進的であり得る。並進的であるアフィンモデルは、同一の制御点動きベクトル(CPMV)を有し得る。同一のCPMVは、ブロック中のサブブロックが同じ動きベクトルを有することを意味し得る。
並進的であるアフィンモデルが同一のCPMVを有する場合、OBMCは、ブロックレベルで(例えば、本明細書で説明するブロックベースのOBMC手法を使用して)実施され得る。OBMCは、例えば、同一のCPMVに基づいて、サブブロックCUをまとめてCU全体として処理し得る。上側帯域及び左側帯域が使用されてもよい。上側帯域及び左側帯域は、サブブロックベースのOBMC手法に関連付けられた帯域よりも大きくなり得る。上側帯域及び左側帯域を使用することにより、複雑さが低減され得、OBMC効率が改善され得る。
BDMVRリファインメントは、通常マージモード及びテンプレートマージモードで実施され得る。両方の場合において、対応する予測子の動きベクトルが精緻化され得る。あらかじめ定義された基準に応じて、独立したサブブロックリファインメントが実施され得る。BDMVRリファインメント又はテンプレートがサブブロックリファインメントを行わない場合、サブブロックは、OBMCによって、CU全体であると考慮され得る。
特徴及び要素は、特定の組み合わせにおいて上で説明されているが、当業者は、各特徴又は要素が単独で又は他の特徴及び要素との任意の組み合わせで使用され得ることを理解されよう。加えて、本明細書に説明される方法は、コンピュータ又はプロセッサによる実行のためにコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアに実装され得る。コンピュータ可読媒体の例には、電子信号(有線接続又は無線接続を介して送信される)及びコンピュータ可読記憶媒体が含まれる。コンピュータ可読記憶媒体の例としては、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスク及びリムーバブルディスクなどの磁気媒体、磁気光学媒体及びCD-ROMディスク及びデジタル多用途ディスク(digital versatile disk、DVD)などの光学媒体が挙げられるが、これらに限定されない。ソフトウェアと関連付けられたプロセッサを使用して、WTRU、UE、端末、基地局、RNC又は任意のホストコンピュータにおいて使用するための無線周波数トランシーバを実装し得る。

Claims (29)

  1. デバイスであって、
    プロセッサを備え、前記プロセッサは、
    複数のサブブロックを備えるコーディングブロックを取得し、
    前記複数のサブブロックが同じ又は類似の動き情報に関連付けられていると判定し、かつ
    前記複数のサブブロックが前記同じ又は類似の動き情報に関連付けられているという前記判定に基づいて、前記複数のサブブロックに対して重複ブロック動き補償(OBMC)をまとめて実施するように構成されている、デバイス。
  2. 前記複数のサブブロックに対してOBMCをまとめて実施することは、ブロックベースのOBMC手法を使用して前記コーディングブロックに対してOBMCを実施することを含む、請求項1に記載のデバイス。
  3. 前記複数のサブブロックは、前記複数のサブブロックの前記動き情報に関連付けられた差分絶対値和がある値を下回るという条件に基づいて、前記同じ又は類似の動き情報に関連付けられていると判定される、請求項1に記載のデバイス。
  4. 前記プロセッサは、
    アフィン動きベクトル予測モードが前記コーディングブロックに対して使用されていると判定し、かつ
    前記コーディングブロックに関連付けられたアフィンモデルに基づいて、前記複数のサブブロックが前記同じ動き情報に関連付けられているかどうかを判定するように更に構成されており、前記複数のサブブロックは、前記コーディングブロックに関連付けられた前記アフィンモデルが並進的であるという条件に基づいて、前記同じ動き情報に関連付けられていると判定される、請求項1に記載のデバイス。
  5. 前記コーディングブロックは、上側帯域と左側帯域とに関連付けられており、前記OBMCは、前記上側帯域及び前記左側帯域に基づいて、前記コーディングブロックに対して全体として実施される、請求項1に記載のデバイス。
  6. デバイスであって、
    プロセッサを備え、前記プロセッサは、
    上側帯域と左側帯域とに関連付けられている現在のブロックを取得し、
    重複ブロック動き補償(OBMC)が前記現在のブロックに対して有効にされていると判定し、
    前記現在のブロックに関連付けられた入力信号から前記現在のブロックの前記上側帯域及び前記左側帯域を減算し、かつ
    前記現在のブロックの前記上側帯域及び前記左側帯域が減算されたこと基づいて動き補償を実施するように構成されている、デバイス。
  7. 前記プロセッサは、
    前記現在のブロックの前記上側帯域及び前記左側帯域が減算されたことに基づいて、動き推定のための高速マージパスを実施するように更に構成されている、請求項6に記載のデバイス。
  8. 前記プロセッサは、
    ブロックレベルマージモードが前記現在のブロックに対して使用されていると判定するように更に構成されており、前記減算は、前記ブロックレベルマージモードが前記現在のブロックに対して使用されているとの前記判定に基づいて実施される、請求項6に記載のデバイス。
  9. 前記プロセッサは、
    通常マージモードが前記現在のブロックに対して使用されていると判定するように更に構成されており、前記減算は、前記通常マージモードが前記現在のブロックに対して使用されているとの前記判定に基づいて実施される、請求項6に記載のデバイス。
  10. 方法であって、
    複数のサブブロックを備えるコーディングブロックを取得することと、
    前記複数のサブブロックが同じ又は類似の動き情報に関連付けられていると判定することと、
    前記複数のサブブロックが前記同じ又は類似の動き情報に関連付けられているという前記判定に基づいて、前記複数のサブブロックに対して重複ブロック動き補償(OBMC)をまとめて実施することと、を含む、方法。
  11. 前記複数のサブブロックに対してOBMCをまとめて実施することは、ブロックベースのOBMC手法を使用して前記コーディングブロックに対してOBMCを実施することを含む、請求項10に記載の方法。
  12. 前記複数のサブブロックは、前記複数のサブブロックの前記動き情報に関連付けられた差分絶対値和がある値を下回るという条件に基づいて、前記同じ又は類似の動き情報に関連付けられていると判定される、請求項10に記載の方法。
  13. アフィン動きベクトル予測モードが前記コーディングブロックに対して使用されていると判定することと、
    前記コーディングブロックに関連付けられたアフィンモデルに基づいて、前記複数のサブブロックが前記同じ動き情報に関連付けられているかどうかを判定することと、を更に含み、前記複数のサブブロックは、前記コーディングブロックに関連付けられた前記アフィンモデルが並進的であることに基づいて、前記同じ動き情報に関連付けられていると判定される、請求項10に記載の方法。
  14. 前記コーディングブロックは、上側帯域と左側帯域とに関連付けられており、前記OBMCは、前記上側帯域及び前記左側帯域に基づいて、前記コーディングブロックに対して全体として実施される、請求項10に記載の方法。
  15. 方法であって、
    上側帯域と左側帯域とに関連付けられている現在のブロックを取得することと、
    重複ブロック動き補償(OBMC)が前記現在のブロックに対して使用されていると判定することと、
    前記現在のブロックに関連付けられた入力信号から前記現在のブロックの前記上側帯域及び前記左側帯域を減算することと、
    前記現在のブロックの前記上側帯域及び前記左側帯域が減算されたことに基づいて動き補償を実施することと、を含む、方法。
  16. 前記現在のブロックの前記上側帯域及び前記左側帯域が減算されたことに基づいて、動き補償のための高速マージパスを実施すること、
    を更に含む、請求項15に記載の方法。
  17. ブロックレベルマージモードが前記現在のブロックに対して使用されていると判定することを更に含み、前記減算は、前記ブロックレベルマージモードが前記現在のブロックに対して使用されているという前記判定に基づいて実施される、
    請求項15に記載の方法。
  18. 通常マージモードが前記現在のブロックに対して使用されていると判定することを更に含み、前記減算は、前記通常マージモードが前記現在のブロックに対して使用されているとの前記判定に基づいて実施される、
    請求項15に記載の方法。
  19. 請求項10~19のいずれか一項に記載の方法においてOBMCを実施することに関連付けられた指示を含む信号。
  20. メモリを更に備える、請求項1~9のいずれか一項に記載のデバイス。
  21. 前記デバイスが、デコーダ又はエンコーダのうちの少なくとも1つである、請求項1~9のいずれか一項に記載のデバイス。
  22. 請求項10~18のいずれか一項に記載の方法に従って生成されたデータコンテンツを含む非一時的コンピュータ可読媒体。
  23. 1つ以上のプロセッサに、請求項10~18のいずれか一項に記載の方法を実施させるための命令を含むコンピュータ可読媒体。
  24. 1つ以上のプロセッサによって実行されるとき、請求項10~17のいずれか一項に記載の方法を実施するための命令を含むコンピュータプログラム製品。
  25. 請求項10~18のいずれか一項に記載の方法に従って生成された、符号化された出力を表す情報を含むビットストリーム。
  26. 装置であって、
    請求項1~9のいずれか一項に記載のデバイスと、
    (i)画像を表すデータを含む信号を受信するように構成されたアンテナ、(ii)受信された前記信号を、前記画像を表す前記データを含む周波数帯域に制限するように構成された制限帯域、又は(iii)前記画像を表示するように構成されたディスプレイのうちの少なくとも1つと、を備える、装置。
  27. TV、携帯電話、タブレット、又はセットトップボックス(STB)を含む、
    請求項1~9のいずれか一項に記載のデバイス。
  28. 装置であって、
    請求項1~9のいずれか一項に記載のデバイスに従ってOBMCを実施することに関連付けられた指示を含むデータにアクセスするように構成されたアクセスユニットと、
    OBMCを実施することに関連付けられた前記指示を含む前記データを送信するように構成された送信機と、を備える、装置。
  29. 方法であって、
    請求項10~18のいずれか一項に記載の方法に従ってOBMCを実施することに関連付けられた指示を含むデータにアクセスすることと、
    請求項10~18のいずれか一項に記載の方法に従ってOBMCを実施することに関連付けられた前記指示を含む前記データを送信することと、を含む、方法。
JP2023562181A 2021-04-12 2022-04-12 重複ブロック動き補償 Pending JP2024513939A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21305480 2021-04-12
EP21305480.2 2021-04-12
PCT/IB2022/000208 WO2022219403A1 (en) 2021-04-12 2022-04-12 Overlapped block motion compensation

Publications (1)

Publication Number Publication Date
JP2024513939A true JP2024513939A (ja) 2024-03-27

Family

ID=75690226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023562181A Pending JP2024513939A (ja) 2021-04-12 2022-04-12 重複ブロック動き補償

Country Status (4)

Country Link
EP (1) EP4324207A1 (ja)
JP (1) JP2024513939A (ja)
CN (1) CN117397241A (ja)
WO (1) WO2022219403A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019060443A1 (en) * 2017-09-20 2019-03-28 Vid Scale, Inc. HANDLING FACIAL DISCONTINUITIES IN 360-DEGREE VIDEO CODING
WO2019089864A1 (en) * 2017-11-01 2019-05-09 Vid Scale, Inc. Overlapped block motion compensation

Also Published As

Publication number Publication date
CN117397241A (zh) 2024-01-12
EP4324207A1 (en) 2024-02-21
WO2022219403A1 (en) 2022-10-20

Similar Documents

Publication Publication Date Title
US20220377344A1 (en) Systems and methods for versatile video coding
WO2020185925A1 (en) Symmetric merge mode motion vector coding
CN113826400A (zh) 用于利用光流的解码器侧运动向量细化的预测细化的方法和装置
US20220394298A1 (en) Transform coding for inter-predicted video data
US20230046946A1 (en) Merge mode, adaptive motion vector precision, and transform skip syntax
US20220345701A1 (en) Intra sub-partitions related infra coding
US20220150486A1 (en) Intra sub-partitions in video coding
KR20220027833A (ko) 광류를 이용한 블록 경계 예측 정제
JP2024513939A (ja) 重複ブロック動き補償
JP7495433B2 (ja) オプティカルフローを用いたブロック境界予測リファインメント
WO2023194193A1 (en) Sign and direction prediction in transform skip and bdpcm
WO2023057488A1 (en) Motion vector coding with input motion vector data
WO2023194570A1 (en) Gradual decoding refresh and coding tools
WO2023194558A1 (en) Improved subblock-based motion vector prediction (sbtmvp)
WO2023194568A1 (en) Template based most probable mode list reordering
WO2023118280A1 (en) Gdr interaction with template based tools in intra slice
WO2023194556A1 (en) Implicit intra mode for combined inter merge/intra prediction and geometric partitioning mode intra/inter prediction
WO2023118048A1 (en) Most probable mode list generation with template-based intra mode derivation and decoder-side intra mode derivation
WO2023118259A1 (en) Video block partitioning based on depth or motion information
CA3232975A1 (en) Template-based syntax element prediction
WO2023194604A1 (en) Template based cclm/mmlm slope adjustment
WO2023194599A1 (en) Memory bandwidth constrained template-based operations
WO2024002895A1 (en) Template matching prediction with sub-sampling
WO2023194600A1 (en) Latency constrained template-based operations
WO2024079193A1 (en) Extended angular prediction modes with decoder side refinement

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231214

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20231222

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20231226