JP7467675B2 - ビデオコーディングのための方法および装置 - Google Patents
ビデオコーディングのための方法および装置 Download PDFInfo
- Publication number
- JP7467675B2 JP7467675B2 JP2022560387A JP2022560387A JP7467675B2 JP 7467675 B2 JP7467675 B2 JP 7467675B2 JP 2022560387 A JP2022560387 A JP 2022560387A JP 2022560387 A JP2022560387 A JP 2022560387A JP 7467675 B2 JP7467675 B2 JP 7467675B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- picture
- information
- coded
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 100
- 238000002372 labelling Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 36
- 230000000153 supplemental effect Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 48
- 230000006835 compression Effects 0.000 description 28
- 238000007906 compression Methods 0.000 description 28
- 230000015654 memory Effects 0.000 description 27
- 230000008569 process Effects 0.000 description 27
- 241000023320 Luma <angiosperm> Species 0.000 description 25
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 25
- 238000010586 diagram Methods 0.000 description 21
- 230000033001 locomotion Effects 0.000 description 21
- 239000000872 buffer Substances 0.000 description 20
- 238000004891 communication Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 10
- 230000011664 signaling Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000013074 reference sample Substances 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- IESVDEZGAHUQJU-ZLBXKVHBSA-N 1-hexadecanoyl-2-(4Z,7Z,10Z,13Z,16Z,19Z-docosahexaenoyl)-sn-glycero-3-phosphocholine Chemical group CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC IESVDEZGAHUQJU-ZLBXKVHBSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本出願は、2021年1月8日に出願された米国仮出願第63/135,530号「SIGNALING OF OBJECTS FOR MACHINE TASKS」に対する優先権の利益を主張する、2021年8月27日に出願された米国特許出願第17/459,753号「METHOD AND APPARATUS FOR VIDEO CODING」に対する優先権の利益を主張する。先行する出願の開示全体が完全な状態で本出願において参照により援用される。
図2は、本開示の一実施形態による通信システム(200)の簡略ブロック図を示す。通信システム(200)は、例えばネットワーク(250)を介して互いに通信し得る複数の端末デバイスを含む。例えば、通信システム(200)は、ネットワーク(250)を介して相互接続された端末デバイス(210)および(220)の第1の対を含む。図2の例において、端末デバイス(210)および(220)の第1の対は、データの単方向送信を実行する。例えば、端末デバイス(210)は、ネットワーク(250)を介して他の端末デバイス(220)に送信するためにビデオデータ(例えば、端末デバイス(210)によってキャプチャされたビデオピクチャのストリーム)をコーディングし得る。エンコーディングされたビデオデータは、1つまたは複数のコーディングされたビデオビットストリームの形式で送信され得る。端末デバイス(220)は、ネットワーク(250)からコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングしてビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示し得る。単方向データ送信は、メディア提供用途などにおいて一般的であり得る。
ビデオまたは画像は、娯楽、教育などの様々な用途のために人間によって消費され得る。このため、ビデオコーディングまたは画像コーディングでは、高い主観的品質を維持しつつ圧縮効率を向上するために、人間の視覚系の特徴を利用することが多い。
VVCは、最近、2つの国際標準化機関、すなわちITUおよびISO/IECによって共同開発された。VVCの一バージョンは、2020年7月に完成され、最先端のビデオコーディング規格の1つである。
H.264、HEVC、または最近完成したVVC規格などのいくつかの関連するビデオコーディング規格では、入力ビデオ信号(またはシーケンス)は、ビデオ内に何人の人、またはいくつのオブジェクトがあるか、それらがどのように動き回るかなど、ビデオコンテンツの意味を理解することなく、波形として扱われる。一方、オブジェクト検出、セグメント化、または追跡などのマシンビジョンタスクは、ビデオシーケンスからこれらのタイプの情報を理解するように設計され得る。ビデオシーケンスをデコーディングした後、クライアント(またはデコーダ)側は、マシンタスクを実行して、画像またはビデオシーケンス内のターゲットオブジェクトのラベリング情報を取得し得る。
図10は、本開示の一実施形態による例示的なプロセス(1000)の概要を示すフローチャートを示している。様々な実施形態において、プロセス(1000)は、端末デバイス(210)、(220)、(230)、および(240)内の処理回路、ビデオエンコーダ(303)の機能を実行する処理回路、ビデオデコーダ(310)の機能を実行する処理回路、ビデオデコーダ(410)の機能を実行する処理回路、イントラ予測モジュール(452)の機能を実行する処理回路、ビデオエンコーダ(503)の機能を実行する処理回路、予測器(535)の機能を実行する処理回路、イントラエンコーダ(622)の機能を実行する処理回路、ならびにイントラデコーダ(772)の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス(1000)は、ソフトウェア命令で実施され、したがって、処理回路がソフトウェア命令を実行するとき、処理回路はプロセス(1000)を実行する。
上記で説明した技術は、コンピュータ可読命令を使用するコンピュータソフトウェアとして実装され、1つまたは複数のコンピュータ可読媒体に物理的に記憶され得る。例えば、図11は、開示された主題の特定の実施形態を実施するために適したコンピュータシステム(1100)を示している。
ALF:適応ループフィルタ(Adaptive Loop Filter)
AMVP:高度動きベクトル予測(Advanced Motion Vector Prediction)
APS:適応パラメータセット(Adaptation Parameter Set)
ASIC:特定用途向け集積回路(Application-Specific Integrated Circuit)
ATMVP:代替/高度時間動きベクトル予測(Alternative/Advanced Temporal Motion Vector Prediction)
AV1:AOMedia Video 1
AV2:AOMedia Video 2
BMS:ベンチマークセット(Benchmark Set)
BV:ブロックベクトル(Block Vector)
CANBus:コントローラエリアネットワークバス(Controller Area Network Bus)
CB:コーディングブロック(Coding Block)
CC-ALF:クロスコンポーネント適応ループフィルタ(Cross-Component Adaptive Loop Filter)
CD:コンパクトディスク(Compact Disc)
CDEF:コンストレインド・ディレクショナル・エンハンスメント・フィルタ(Constrained Directional Enhancement Filter)
CPR:現在のピクチャ参照(Current Picture Referencing)
CPU:中央処理装置(Central Processing Unit)
CRT:ブラウン管(Cathode Ray Tube)
CTB:コーディングツリーブロック(Coding Tree Block)
CTU:コーディングツリーユニット(Coding Tree Unit)
CU:コーディングユニット(Coding Unit)
DPB:デコーダピクチャバッファ(Decoder Picture Buffer)
DPCM:差動パルス符号変調(Differential Pulse-Code Modulation)
DPS:デコーディングパラメータセット(Decoding Parameter Set)
DVD:デジタルビデオディスク(Digital Video Disc)
FPGA:フィールドプログラマブルゲートエリア(Field Programmable Gate Area)
JCCR:共同CbCr残差コーディング(Joint CbCr Residual Coding)
JVET:共同ビデオ探索チーム(Joint Video Exploration Team)
GOP:ピクチャのグループ(Groups of Pictures)
GPU:グラフィック処理装置(Graphics Processing Unit)
GSM:グローバル移動体通信システム(Global System for Mobile communication)
HDR:ハイダイナミックレンジ(High Dynamic Range)
HEVC:高効率ビデオコーディング(High Efficiency Video Coding)
HRD:仮想参照デコーダ(Hypothetical Reference Decoder)
IBC:イントラブロックコピー(Intra Block Copy)
IC:集積回路(Integrated Circuit)
ISP:イントラサブパーティション(Intra Sub-Partitions)
JEM:共同探索モデル(Joint Exploration Model)
LAN:ローカルエリアネットワーク(Local Area Network)
LCD:液晶ディスプレイ(Liquid-Crystal Display)
LR:ループ復元フィルタ(Loop Restoration Filter)
LRU:ループ復元ユニット(Loop Restoration Unit)
LTE:ロングタームエボリューション(Long-Term Evolution)
MPM:最確モード(Most Probable Mode)
MV:動きベクトル(Motion Vector)
OLED:有機発光ダイオード(Organic Light-Emitting Diode)
PB:予測ブロック(Prediction Block)
PCI:周辺構成要素相互接続(Peripheral Component Interconnect)
PDPC:位置依存予測組合せ(Position Dependent Prediction Combination)
PLD:プログラマブル論理デバイス(Programmable Logic Device)
PPS:ピクチャパラメータセット(Picture Parameter Set)
PU:予測ユニット(Prediction Unit)
RAM:ランダムアクセスメモリ(Random Access Memory)
ROM:読み出し専用メモリ(Read-Only Memory)
SAO:サンプル適応オフセット(Sample Adaptive Offset)
SCC:スクリーンコンテンツコーディング(Screen Content Coding)
SDR:標準ダイナミックレンジ(Standard Dynamic Range)
SEI:補足拡張情報(Supplementary Enhancement Information)
SNR:信号対雑音比(Signal Noise Ratio)
SPS:シーケンスパラメータセット(Sequence Parameter Set)
SSD:ソリッドステートドライブ(Solid-state Drive)
TU:変換ユニット(Transform Unit)
USB:ユニバーサルシリアルバス(Universal Serial Bus)
VPS:ビデオパラメータセット(Video Parameter Set)
VUI:ビデオのユーザビリティ情報(Video Usability Information)
VVC:多用途ビデオコーディング(Versatile Video Coding)
WAIP:広角イントラ予測(Wide-Angle Intra Prediction)
210,220,230,240 端末デバイス
250 ネットワーク
301 ビデオソース
302 ビデオピクチャのストリーム
303 ビデオエンコーダ
304 エンコーディングされたビデオデータ
305 ストリーミングサーバ
306 クライアントサブシステム
307 エンコーディングされたビデオデータのコピー
308 クライアントサブシステム
309 エンコーディングされたビデオデータのコピー
310 ビデオデコーダ
311 ビデオピクチャ
312 ディスプレイ
313 キャプチャサブシステム
320 電子デバイス
330 電子デバイス
401 チャネル
410 ビデオデコーダ
412 レンダデバイス
415 バッファメモリ
420 エントロピーデコーダ/パーサ
421 シンボル
430 電子デバイス
431 受信機
451 スケーラ/逆変換ユニット
452 イントラピクチャ予測ユニット
453 動き補償予測ユニット
455 アグリゲータ
456 ループフィルタユニット
457 参照ピクチャメモリ
458 現在のピクチャバッファ
501 ビデオソース
503 ビデオエンコーダ
520 電子デバイス
530 ソースコーダ
532 コーディングエンジン
533 ローカルビデオデコーダ
534 参照ピクチャメモリ
535 予測器
540 送信機
543 ビデオシーケンス
545 エントロピーコーダ
550 コントローラ
560 通信チャネル
603 ビデオエンコーダ
621 汎用コントローラ
622 イントラエンコーダ
623 残差計算器
624 残差エンコーダ
625 エントロピーエンコーダ
626 スイッチ
628 残差デコーダ
630 インターエンコーダ
710 ビデオデコーダ
771 エントロピーデコーダ
772 イントラデコーダ
773 残差デコーダ
774 再構成モジュール
780 インターデコーダ
1101 キーボード
1102 マウス
1103 トラックパッド
1105 ジョイスティック
1106 マイクロフォン
1107 スキャナ
1108 カメラ
1110 タッチスクリーン
1120 CD/DVD ROM/RW
1121 媒体
1122 サムドライブ
1123 ソリッドステートドライブ
1140 コア
1141 中央処理装置
1142 グラフィック処理装置
1143 フィールドプログラマブルゲートエリア
1144 ハードウェアアクセラレータ
1145 読み出し専用メモリ
1146 ランダムアクセスメモリ
1147 内部大容量記憶装置
1148 システムバス
1149 周辺バス
1150 グラフィックアダプタ
1154 ネットワークインターフェース
1155 通信ネットワーク
Claims (10)
- デコーダにおけるビデオコーディングの方法であって、
コーディングされたビデオビットストリームに関連付けられたメタデータを受信するステップであって、前記メタデータが、前記コーディングされたビデオビットストリームにおいてコーディングされた第1のピクチャ内で検出された1つまたは複数のオブジェクトのラベリング情報を含み、前記ラベリング情報が、境界ボックスの位置オフセット情報を含み、前記位置オフセット情報は、前記第1のピクチャと前記ビデオビットストリームにおいてコーディングされた第2のピクチャとの間での前記境界ボックスの相対的な位置の差を示す、ステップと、
前記コーディングされたビデオビットストリームにおいてコーディングされた前記第1のピクチャ内の前記1つまたは複数のオブジェクトの前記ラベリング情報をデコーディングするステップと、
前記ラベリング情報を前記第1のピクチャ内の前記1つまたは複数のオブジェクトに適用するステップと
を含む方法。 - 前記メタデータが、前記コーディングされたビデオビットストリーム内の補足拡張情報(SEI)メッセージに含まれる、請求項1に記載の方法。
- 前記メタデータが、前記コーディングされたビデオビットストリームとは別のファイルに含まれる、請求項1に記載の方法。
- 前記ラベリング情報が、前記第1のピクチャ内の境界ボックスの総数を示し、各境界ボックスの位置情報およびサイズ情報を含み、
各境界ボックスが、前記第1のピクチャ内の前記1つまたは複数のオブジェクトのうちの1つのオブジェクトに関連付けられる、請求項1に記載の方法。 - 前記ラベリング情報が、前記1つまたは複数のオブジェクトの各々に対するカテゴリを示すカテゴリ情報を含む、請求項1に記載の方法。
- 前記ラベリング情報が、ビデオシーケンス内の前記1つまたは複数のオブジェクトの各々を識別する識別情報を含む、請求項1に記載の方法。
- 前記境界ボックスのうちの1つの境界ボックスの前記位置情報が、前記第1のピクチャ内に存在しない前記境界ボックスのうちの前記1つの境界ボックスに関連付けられたオブジェクトに基づいて、前記境界ボックスのうちの前記1つの境界ボックスに対する前記第1のピクチャの外側の位置を示す、請求項4に記載の方法。
- 前記コーディングされたビデオビットストリームに関連付けられた前記メタデータを受信する要求を送信するステップ
をさらに含む、請求項1に記載の方法。 - 請求項1から8のいずれか一項に記載の方法を実行するように構成された処理回路
を備える装置。 - 命令を記憶した非一時的なコンピュータ可読記憶媒体であって、前記命令は、少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、請求項1から8のいずれか一項に記載の方法を実行させる、非一時的なコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024060305A JP2024074919A (ja) | 2021-01-08 | 2024-04-03 | ビデオコーディングのための方法および装置 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163135530P | 2021-01-08 | 2021-01-08 | |
US63/135,530 | 2021-01-08 | ||
US17/459,753 | 2021-08-27 | ||
US17/459,753 US11831920B2 (en) | 2021-01-08 | 2021-08-27 | Method and apparatus for video coding |
PCT/US2021/048660 WO2022150066A1 (en) | 2021-01-08 | 2021-09-01 | Method and apparatus for video coding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024060305A Division JP2024074919A (ja) | 2021-01-08 | 2024-04-03 | ビデオコーディングのための方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023521047A JP2023521047A (ja) | 2023-05-23 |
JP7467675B2 true JP7467675B2 (ja) | 2024-04-15 |
Family
ID=82322380
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022560387A Active JP7467675B2 (ja) | 2021-01-08 | 2021-09-01 | ビデオコーディングのための方法および装置 |
JP2024060305A Pending JP2024074919A (ja) | 2021-01-08 | 2024-04-03 | ビデオコーディングのための方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024060305A Pending JP2024074919A (ja) | 2021-01-08 | 2024-04-03 | ビデオコーディングのための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11831920B2 (ja) |
EP (1) | EP4107693A4 (ja) |
JP (2) | JP7467675B2 (ja) |
KR (1) | KR20220165274A (ja) |
CN (1) | CN115380306A (ja) |
WO (1) | WO2022150066A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021060827A1 (ko) * | 2019-09-23 | 2021-04-01 | 엘지전자 주식회사 | 변환에 기반한 영상 코딩 방법 및 그 장치 |
CN116170581B (zh) * | 2023-02-17 | 2024-01-23 | 厦门瑞为信息技术有限公司 | 一种基于目标感知的视频信息编解码方法和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120275524A1 (en) | 2011-04-28 | 2012-11-01 | Industrial Technology Research Institute | Systems and methods for processing shadows in compressed video images |
US20120281904A1 (en) | 2008-08-27 | 2012-11-08 | International Business Machines Corporation | System and method for automatic recognition and labeling of anatomical structures and vessels in medical imaging scans |
JP2014523696A (ja) | 2011-06-30 | 2014-09-11 | エルジー エレクトロニクス インコーポレイティド | 補間方法及びそれを利用した予測方法 |
JP2015513386A (ja) | 2012-02-17 | 2015-05-11 | マイクロソフト コーポレーション | メタデータ支援ビデオ復号 |
US20150304665A1 (en) | 2014-01-07 | 2015-10-22 | Nokia Corporation | Method and apparatus for video coding and decoding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10645344B2 (en) * | 2010-09-10 | 2020-05-05 | Avigilion Analytics Corporation | Video system with intelligent visual display |
GB201501510D0 (en) * | 2015-01-29 | 2015-03-18 | Apical Ltd | System |
WO2018049321A1 (en) * | 2016-09-12 | 2018-03-15 | Vid Scale, Inc. | Method and systems for displaying a portion of a video stream with partial zoom ratios |
RU2632427C1 (ru) * | 2016-12-09 | 2017-10-04 | Общество с ограниченной ответственностью "Аби Девелопмент" | Оптимизация обмена данными между клиентским устройством и сервером |
US9660967B1 (en) * | 2017-01-09 | 2017-05-23 | Centri Technology, Inc. | Big data markers for stream labeling, identification and decoding |
CN110348270B (zh) * | 2018-04-03 | 2023-06-09 | 扬智科技股份有限公司 | 影像物件辨识方法与影像物件辨识系统 |
WO2019208372A1 (ja) * | 2018-04-25 | 2019-10-31 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法及び復号方法 |
US11010907B1 (en) * | 2018-11-27 | 2021-05-18 | Zoox, Inc. | Bounding box selection |
US10817739B2 (en) * | 2019-01-31 | 2020-10-27 | Adobe Inc. | Content-aware selection |
US11699063B2 (en) * | 2019-02-25 | 2023-07-11 | Intel Corporation | Partial inference path technology in general object detection networks for efficient video processing |
EP4115624A4 (en) * | 2020-03-03 | 2024-03-27 | Nokia Technologies Oy | EFFICIENT READOUT OF VOLUMETRIC VIDEO ATLASBIT STREAMS |
-
2021
- 2021-08-27 US US17/459,753 patent/US11831920B2/en active Active
- 2021-09-01 WO PCT/US2021/048660 patent/WO2022150066A1/en unknown
- 2021-09-01 KR KR1020227039078A patent/KR20220165274A/ko active Search and Examination
- 2021-09-01 JP JP2022560387A patent/JP7467675B2/ja active Active
- 2021-09-01 CN CN202180026015.3A patent/CN115380306A/zh active Pending
- 2021-09-01 EP EP21918016.3A patent/EP4107693A4/en active Pending
-
2023
- 2023-10-23 US US18/492,012 patent/US20240048773A1/en active Pending
-
2024
- 2024-04-03 JP JP2024060305A patent/JP2024074919A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120281904A1 (en) | 2008-08-27 | 2012-11-08 | International Business Machines Corporation | System and method for automatic recognition and labeling of anatomical structures and vessels in medical imaging scans |
US20120275524A1 (en) | 2011-04-28 | 2012-11-01 | Industrial Technology Research Institute | Systems and methods for processing shadows in compressed video images |
JP2014523696A (ja) | 2011-06-30 | 2014-09-11 | エルジー エレクトロニクス インコーポレイティド | 補間方法及びそれを利用した予測方法 |
JP2015513386A (ja) | 2012-02-17 | 2015-05-11 | マイクロソフト コーポレーション | メタデータ支援ビデオ復号 |
US20150304665A1 (en) | 2014-01-07 | 2015-10-22 | Nokia Corporation | Method and apparatus for video coding and decoding |
Non-Patent Citations (3)
Title |
---|
Anthony Vetro et al.,Overview of the Stereo and Multiview Video Coding Extensions of the H.264/MPEG-4 AVC Standard [online],Published in: Proceedings of the IEEE ( Volume: 99 , Issue: 4, April 2011), [2023年9月5日検索],2011年01月31日,pp.626-642,インターネット <URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=5705534>,DOI: 10.1109/JPROC.2010.2098830 |
Jill Boyce et al.,Object tracking SEI message (now Annotated region SEI message) [online],JCTVC-AE0027-v4, [2023年9月5日検索],インターネット <URL: http://phenix.it-sudparis.eu/jct/doc_end_user/documents/31_San%20Diego/wg11/JCTVC-AE0027-v4.zip>,2018年04月17日 |
Jill Boyce et al.,Proposed revision to Annotated regions SEI message for HEVC and inclusion in AVC [online],JCTVC-AK0025, [2023年9月5日検索],インターネット <URL: http://phenix.it-sudparis.eu/jct/doc_end_user/documents/37_Geneva/wg11/JCTVC-AK0025-v3 .zip>,2019年09月25日 |
Also Published As
Publication number | Publication date |
---|---|
US20220224943A1 (en) | 2022-07-14 |
EP4107693A1 (en) | 2022-12-28 |
CN115380306A (zh) | 2022-11-22 |
EP4107693A4 (en) | 2023-05-10 |
KR20220165274A (ko) | 2022-12-14 |
JP2023521047A (ja) | 2023-05-23 |
US20240048773A1 (en) | 2024-02-08 |
WO2022150066A1 (en) | 2022-07-14 |
US11831920B2 (en) | 2023-11-28 |
JP2024074919A (ja) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7405926B2 (ja) | 動画の符号化及び復号方法、装置、並びにコンピュータプログラム | |
JP7343668B2 (ja) | Vvcにおける色変換のための方法及び機器 | |
JP7502190B2 (ja) | ビデオ符号化のための方法並びにその装置及びコンピュータプログラム | |
KR20200131328A (ko) | 가장 가능성이 높은 모드를 도출하기 위한 방법 및 장치 | |
JP7359951B2 (ja) | ビデオ符号化のための方法、装置、媒体およびコンピュータ・プログラム | |
US20240048773A1 (en) | Labeling detected objects in frames of a video | |
JP7236558B2 (ja) | ビデオコーディングのための方法および装置 | |
JP2023158110A (ja) | ビデオ復号方法、ビデオ復号装置、コンピュータプログラム、およびビデオ符号化方法 | |
JP2024509231A (ja) | イントラ予測の融合に関する修正 | |
JP7482246B2 (ja) | 機械のためのビデオ符号化のための方法、装置およびコンピュータ・プログラム | |
JP7189370B2 (ja) | Cuに基づく補間フィルタ選択のシグナリング | |
JP7130883B2 (ja) | ビデオ符号化のための方法、装置およびコンピュータ・プログラム | |
JP7524347B2 (ja) | ビデオコーディングのための方法および装置、およびコンピュータプログラム | |
JP7512407B2 (ja) | ビデオコーディングのための方法および装置 | |
JP2024516763A (ja) | 適応型多重変換セット選択 | |
JP2023547170A (ja) | 改善されたイントラ予測のための方法および装置 | |
CN112437306A (zh) | 视频编解码方法、装置、计算机设备和存储介质 | |
JP7524470B2 (ja) | 補足強化情報メッセージを再サンプリングするワーピングベースの復号ピクチャ | |
JP7514325B2 (ja) | ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびコンピュータプログラム | |
JP7540828B2 (ja) | 映像復号のための方法、装置、及びコンピュータプログラム | |
JP7439344B2 (ja) | ビデオデコーディングのための方法、デバイス、およびコンピュータプログラム | |
JP7392127B2 (ja) | ビデオ符号化のための方法、装置およびコンピュータ・プログラム | |
JP2023552141A (ja) | 適応的ローカル参照範囲によるイントラブロックコピー | |
JP2023549155A (ja) | ビデオコーディング方法、装置、およびコンピュータプログラム | |
JPWO2023044254A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7467675 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |