JP2023524000A - 品質正規化ビデオコード変換のための動的パラメータ選択 - Google Patents
品質正規化ビデオコード変換のための動的パラメータ選択 Download PDFInfo
- Publication number
- JP2023524000A JP2023524000A JP2022565893A JP2022565893A JP2023524000A JP 2023524000 A JP2023524000 A JP 2023524000A JP 2022565893 A JP2022565893 A JP 2022565893A JP 2022565893 A JP2022565893 A JP 2022565893A JP 2023524000 A JP2023524000 A JP 2023524000A
- Authority
- JP
- Japan
- Prior art keywords
- video
- bitrate
- transcoding
- quality
- quality score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009826 distribution Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 92
- 238000012549 training Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 27
- 230000015654 memory Effects 0.000 claims description 27
- 238000005259 measurement Methods 0.000 claims description 19
- 238000003908 quality control method Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013442 quality metrics Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/27—Server based end-user applications
- H04N21/274—Storing end-user multimedia data in response to end-user request, e.g. network recorder
- H04N21/2743—Video hosting of uploaded data from client
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/23439—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234363—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
- H04N21/4666—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Graphics (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
102 送信局
104 ネットワーク
106 受信局
200 コンピューティングデバイス
202 プロセッサ
204 メモリ
206 コードおよびデータ
208 オペレーティングシステム
210 アプリケーションプログラム
212 バス
214 2次記憶装置
218 ディスプレイ
220 画像感知デバイス
222 音響感知デバイス
300 ビデオストリーム
302 ビデオシーケンス
304 隣接フレーム
306 フレーム
308 セグメント
310 ブロック
400 エンコーダ
402 イントラ/インター予測段階
404 変換段階
406 量子化段階
408 エントロピー符号化段階
410 逆量子化段階
412 逆変換段階
414 復元段階
416 ループフィルタリング段階
420 ビットストリーム
500 デコーダ
502 エントロピー復号段階
504 逆量子化段階
506 逆変換段階
508 イントラ/インター予測段階
510 復元段階
512 ループフィルタリング段階
514 ポストフィルタ段階
516 出力ビデオストリーム
600 コード変換器
602 ビデオストリーム
604 コード変換段階
606 コード変換ビデオストリーム1
608 コード変換ビデオストリームN
700 コード変換器
702 パラメータ予測段階
704 パラメータ選択段階
706 コード変換段階
708 コード変換ビデオストリーム1
710 コード変換ビデオストリームM
712 学習モデル
Claims (20)
- ユーザ作成ビデオコンテンツのビデオストリームをコード変換するための方法であって、
複数の解像度においてユーザ作成ビデオコンテンツのセットに対するコード変換品質を予測するように訓練された学習モデルを、前記ユーザ作成ビデオコンテンツに関連する情報を使用してクエリすることによって、複数の解像度において前記ビデオストリームの前記ユーザ作成ビデオコンテンツをコード変換するためのビットレートおよび品質スコアを決定するステップと、
前記複数の解像度の各々において前記ビデオストリームをコード変換するために使用するためのコード変換パラメータのセットを、前記ビットレートおよび品質スコアに従って選択するステップであって、コード変換パラメータの各セットは前記複数の解像度のうちの1つの異なる解像度に対応する、ステップと、
前記選択されたコード変換パラメータのセットを使用して前記ビデオストリームを複数のコード変換ビデオストリームにコード変換するステップであって、前記複数のコード変換ビデオストリームの各々は、前記コード変換のために使用された前記コード変換パラメータの前記セットに対応する前記1つの異なる解像度においてコード変換される、ステップと、
さらなる処理または記憶のために前記複数のコード変換ビデオストリームを出力するステップとを含み、前記複数のコード変換ビデオストリームのうちの1つのコード変換ビデオストリームが、前記コード変換ビデオストリームに対応する解像度の選択に応答してクライアントデバイスにおいて表示するように構成される、方法。 - 前記複数の解像度において前記ビデオストリームの前記ユーザ作成ビデオコンテンツをコード変換するための前記ビットレートおよび品質スコアを決定するステップが、
前記複数の解像度に対する前記ビデオストリームの予測される配信品質レベルを、前記学習モデルの出力として受信するステップであって、所与の予測される配信品質レベルは、前記ビデオストリームが前記複数の解像度のうちの対応する1つに対して規定のビットレートにおいてコード変換されるときに前記ビデオストリームの品質を表す、ステップと、
前記予測される配信品質レベルを使用してビットレートおよび品質スコアペアのセットを決定するステップとを含み、ビットレートおよび品質スコアペアの各セットが、前記複数の解像度のうちの1つの解像度に対応する、請求項1に記載の方法。 - 前記学習モデルは、1つまたは複数の品質制御メトリックを使用して前記ビデオストリームから抽出された1つまたは複数のビデオフレームを処理することによって前記予測される配信品質レベルを計算し、前記ユーザ作成ビデオコンテンツに関連する前記情報は、前記1つまたは複数のビデオフレームに対応する、請求項2に記載の方法。
- 所与のビットレートおよび品質スコアペアのセットにおける各ビットレートが、前記所与のビットレートおよび品質スコアペアのセットに対応する解像度に対して許容される最大ビットレート以下である、請求項2または3のいずれか一項に記載の方法。
- 前記複数の解像度の各々において前記ビデオストリームをコード変換するために使用するための前記コード変換パラメータのセットを選択するステップが、
前記ビットレートおよび品質スコアペアのセットの各々に対して、
前記ビットレートおよび品質スコアペアのセットに対応する解像度に関連する加重値を決定するために、非線形最適化関数を使用して前記ビットレートおよび品質スコアペアのセットのうちの各ビットレートおよび品質スコアペアを処理するステップと、
前記加重値のうちの最高のものをもたらす、前記ビットレートおよび品質スコアペアのセットのうちの1つのビットレートおよび品質スコアペアを、前記コード変換パラメータのセットのうちの1つとして選択するステップとを含む、請求項2から4のいずれか一項に記載の方法。 - 前記非線形最適化関数は、1つまたは複数の所定のしきい値を使用してビットレートおよび品質スコアペアの各セットのうちの前記ビットレートおよび品質スコアペアを処理する、請求項5に記載の方法。
- 前記1つまたは複数の所定のしきい値は、総ビットレートの上界、前記複数の解像度の一部もしくは全部において許容される最大ビットレート、または画質差測定しきい値のうちの1つまたは複数に関する、請求項6に記載の方法。
- 前記1つまたは複数の所定のしきい値が前記画質差測定しきい値に関するとき、前記非線形最適化関数を使用して前記ビットレートおよび品質スコアペアのセットのうちの各ビットレートおよび品質スコアペアを処理するステップが、
前記ビットレートおよび品質スコアペアのうちの、前記画質差測定しきい値を満たさないものを間引くステップを含み、
前記加重値は、前記ビットレートおよび品質スコアペアのうちの残りのものに対して決定される、請求項7に記載の方法。 - 前記1つまたは複数の所定のしきい値は、前記ビットレートおよび品質スコアペアのセットに対応する前記解像度に対して規定された重みに関し、前記非線形最適化関数を使用して前記ビットレートおよび品質スコアペアのセットのうちの各ビットレートおよび品質スコアペアを処理するステップが、
前記重みを使用して前記ビットレートおよび品質スコアペアの前記品質スコアを重み付けることによって、前記ビットレートおよび品質スコアペアのセットのうちの1つのビットレートおよび品質スコアペアに対する加重値を決定するステップを含む、請求項6に記載の方法。 - 前記複数のコード変換ビデオストリームは、ビデオホスティングプラットフォームに出力され、前記複数の解像度の各々に対して規定された重みが、前記ビデオホスティングプラットフォームにアップロードされたビデオにわたって前記複数の解像度に対する視聴時間分布に基づいて決定される、請求項9に記載の方法。
- 前記複数のコード変換ビデオストリームは、ビデオホスティングプラットフォームに出力され、前記学習モデルは、
前記ビデオホスティングプラットフォームのユーザ作成ビデオコンテンツから生ビデオフレームを抽出するステップと、
前記生ビデオフレームのビデオコンテンツを使用して前記学習モデルを訓練するステップとによって、前記複数の解像度においてユーザ作成ビデオコンテンツに対するコード変換品質を予測するように訓練される、請求項1に記載の方法。 - 前記学習モデルは、
前記生ビデオフレームの前記ビデオコンテンツを使用して前記学習モデルを訓練する前に、前記生ビデオフレームを前処理するステップによってさらに訓練される、請求項11に記載の方法。 - 前記生ビデオフレームを前処理するステップが、
前記生ビデオフレームのピクセルデータをRGB色成分からYUV色成分に変換するステップを含み、
前記学習モデルは、前記YUV色成分のうちのY色成分に対応する前記ピクセルデータのみを使用して訓練される、請求項12に記載の方法。 - 前記生ビデオフレームを前処理するステップが、
前記生ビデオフレームのうちの1つまたは複数が非標準解像度にあるかどうかを決定するステップと、
前記生ビデオフレームのうちの前記1つまたは複数が前記非標準解像度内にあると決定するステップに応答して、ゼロ値係数を有する前記生ビデオフレームのうちの前記1つまたは複数をパディングすることによって、前記生ビデオフレームのうちの前記1つまたは複数を標準解像度に拡大縮小するステップとを含む、請求項12に記載の方法。 - 前記生ビデオフレームの前記ビデオコンテンツを使用して前記学習モデルを訓練するステップが、
ビデオフレームの空間的または時間的特徴を予測するために生成された特徴マップを使用して前記生ビデオフレームのうちの1つのビデオフレームを処理するステップを含む、請求項11に記載の方法。 - 前記特徴マップは、ガボールフィルタを使用して生成された空間的特徴の2次元マップである、請求項15に記載の方法。
- 前記特徴マップは、前記ビデオフレームの基準ビデオフレームを使用して生成された時間的特徴の2次元最適フローである、請求項15に記載の方法。
- 前記ユーザ作成ビデオコンテンツのセットは、複数のビデオコンテンツカテゴリーに対応し、前記学習モデルは、前記複数のビデオコンテンツカテゴリーに対して学習された構成に従って前記生ビデオフレームの配信品質レベルを予測するように訓練される、請求項11から17のいずれか一項に記載の方法。
- メモリとプロセッサとを含む装置であって、前記メモリは、請求項1から18のいずれか一項に記載の前記方法を実行するために、前記プロセッサによって実行可能な命令を含む、装置。
- 請求項1から18のいずれか一項に記載の前記方法を実行するように構成されている、コード変換器。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2020/033538 WO2021236059A1 (en) | 2020-05-19 | 2020-05-19 | Dynamic parameter selection for quality-normalized video transcoding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023524000A true JP2023524000A (ja) | 2023-06-08 |
Family
ID=71069991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022565893A Pending JP2023524000A (ja) | 2020-05-19 | 2020-05-19 | 品質正規化ビデオコード変換のための動的パラメータ選択 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230104270A1 (ja) |
EP (1) | EP3942836A1 (ja) |
JP (1) | JP2023524000A (ja) |
KR (1) | KR20220146647A (ja) |
CN (1) | CN115349263A (ja) |
WO (1) | WO2021236059A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113518250B (zh) * | 2020-08-07 | 2022-08-02 | 腾讯科技(深圳)有限公司 | 一种多媒体数据处理方法、装置、设备及可读存储介质 |
CN117242499A (zh) * | 2021-12-20 | 2023-12-15 | 腾讯云欧洲(法国)简易股份公司 | 自动视频质量评估 |
CN114640851B (zh) * | 2022-03-18 | 2023-06-23 | 广西昊华科技股份有限公司 | 基于质量感知的自适应全向视频流的传输方法 |
CN114866840A (zh) * | 2022-03-31 | 2022-08-05 | 广州方硅信息技术有限公司 | Vmaf画质评价方法、终端、主机、系统及存储介质 |
CN115002520B (zh) * | 2022-04-14 | 2024-04-02 | 百果园技术(新加坡)有限公司 | 一种视频流数据处理方法、装置、设备及存储介质 |
CN115225928B (zh) * | 2022-05-11 | 2023-07-25 | 北京广播电视台 | 一种多类型音视频混播系统及方法 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6957350B1 (en) * | 1996-01-30 | 2005-10-18 | Dolby Laboratories Licensing Corporation | Encrypted and watermarked temporal and resolution layering in advanced television |
US5790839A (en) * | 1996-12-20 | 1998-08-04 | International Business Machines Corporation | System integration of DRAM macros and logic cores in a single chip architecture |
US5901304A (en) * | 1997-03-13 | 1999-05-04 | International Business Machines Corporation | Emulating quasi-synchronous DRAM with asynchronous DRAM |
KR100244769B1 (ko) * | 1997-06-26 | 2000-02-15 | 전주범 | 스케일러빌리티를 갖는 간 윤곽선 부호화 방법 및 장치 |
KR100240770B1 (ko) * | 1997-07-11 | 2000-01-15 | 이형도 | 에너지보상/역보상기능을개선한스케러블부호화기및그방법 |
US6765962B1 (en) * | 1999-12-02 | 2004-07-20 | Sarnoff Corporation | Adaptive selection of quantization scales for video encoding |
US6826232B2 (en) * | 1999-12-20 | 2004-11-30 | Koninklijke Philips Electronics N.V. | Fine granular scalable video with embedded DCT coding of the enhancement layer |
CA2395605C (en) * | 1999-12-22 | 2011-04-05 | General Instrument Corporation | Video compression for multicast environments using spatial scalability and simulcast coding |
US7477688B1 (en) * | 2000-01-26 | 2009-01-13 | Cisco Technology, Inc. | Methods for efficient bandwidth scaling of compressed video data |
US7095782B1 (en) * | 2000-03-01 | 2006-08-22 | Koninklijke Philips Electronics N.V. | Method and apparatus for streaming scalable video |
US6771703B1 (en) * | 2000-06-30 | 2004-08-03 | Emc Corporation | Efficient scaling of nonscalable MPEG-2 Video |
US7016412B1 (en) * | 2000-08-29 | 2006-03-21 | Koninklijke Philips Electronics N.V. | System and method for dynamic adaptive decoding of scalable video to balance CPU load |
AU2002213713A1 (en) * | 2000-10-24 | 2002-05-06 | Eyeball Networks Inc. | Dct-based scalable video compression |
US7263124B2 (en) * | 2001-09-26 | 2007-08-28 | Intel Corporation | Scalable coding scheme for low latency applications |
US7729421B2 (en) * | 2002-02-20 | 2010-06-01 | International Business Machines Corporation | Low latency video decoder with high-quality, variable scaling and minimal frame buffer memory |
US7391807B2 (en) * | 2002-04-24 | 2008-06-24 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoding of scalable multi-layer videos to single layer video |
KR20060105407A (ko) * | 2005-04-01 | 2006-10-11 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
US7369610B2 (en) * | 2003-12-01 | 2008-05-06 | Microsoft Corporation | Enhancement layer switching for scalable video coding |
US7697608B2 (en) * | 2004-02-03 | 2010-04-13 | Sony Corporation | Scalable MPEG video/macro block rate control |
KR100677142B1 (ko) * | 2004-08-13 | 2007-02-02 | 경희대학교 산학협력단 | 파노라마 영상의 움직임 추정 및 보상 |
KR101233854B1 (ko) * | 2005-02-18 | 2013-02-15 | 톰슨 라이센싱 | 저해상도 픽처로부터 고해상도 픽처에 대한 코딩 정보를도출하기 위한 방법 및 이 방법을 구현하는 코딩 및 디코딩장치 |
KR100732961B1 (ko) * | 2005-04-01 | 2007-06-27 | 경희대학교 산학협력단 | 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치 |
JP4934139B2 (ja) * | 2005-08-30 | 2012-05-16 | トムソン ライセンシング | Ieee802.11無線ローカル・エリア・ネットワーク上でのスケーラブル・ビデオ・マルチキャストのためのクロス・レイヤ最適化 |
JP2007081720A (ja) * | 2005-09-13 | 2007-03-29 | Sanyo Electric Co Ltd | 符号化方法 |
US8401091B2 (en) * | 2006-01-09 | 2013-03-19 | Lg Electronics Inc. | Inter-layer prediction method for video signal |
US8635357B2 (en) * | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
TWI416961B (zh) * | 2010-04-02 | 2013-11-21 | Univ Nat Chiao Tung | 用於可調式視訊編碼系統之選擇性移動向量預測方法、移動估測方法及其裝置 |
US20110268175A1 (en) * | 2010-04-30 | 2011-11-03 | Wai-Tian Tan | Differential protection of a live scalable media |
US9338465B2 (en) * | 2011-06-30 | 2016-05-10 | Sharp Kabushiki Kaisha | Context initialization based on decoder picture buffer |
US20130028324A1 (en) * | 2011-07-29 | 2013-01-31 | National Chiao Tung University | Method and device for decoding a scalable video signal utilizing an inter-layer prediction |
WO2013115560A1 (ko) * | 2012-01-30 | 2013-08-08 | 삼성전자 주식회사 | 공간 서브영역별로 비디오를 부호화하는 방법 및 그 장치, 공간 서브영역별로 비디오를 복호화하는 방법 및 그 장치 |
US9124899B2 (en) * | 2012-09-28 | 2015-09-01 | Sharp Laboratories Of America, Inc. | Motion derivation and coding for scaling video |
US9918082B2 (en) * | 2014-10-20 | 2018-03-13 | Google Llc | Continuous prediction domain |
JP6559337B2 (ja) * | 2015-09-23 | 2019-08-14 | ノキア テクノロジーズ オーユー | 360度パノラマビデオの符号化方法、符号化装置、及びコンピュータプログラム |
US20170214937A1 (en) * | 2016-01-22 | 2017-07-27 | Mediatek Inc. | Apparatus of Inter Prediction for Spherical Images and Cubic Images |
US10454987B2 (en) * | 2016-10-28 | 2019-10-22 | Google Llc | Bitrate optimization for multi-representation encoding using playback statistics |
EP3422724B1 (en) * | 2017-06-26 | 2024-05-01 | Nokia Technologies Oy | An apparatus, a method and a computer program for omnidirectional video |
US10999578B2 (en) * | 2017-12-12 | 2021-05-04 | Google Llc | Transcoding media content using an aggregated quality score |
US11509937B2 (en) * | 2018-04-09 | 2022-11-22 | Sk Telecom Co., Ltd. | Method and apparatus for encoding/decoding video |
KR20210057148A (ko) * | 2018-09-14 | 2021-05-20 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 비디오 코딩에서의 슬라이싱 및 타일링 |
EP3855740A4 (en) * | 2018-09-19 | 2022-09-28 | Electronics and Telecommunications Research Institute | METHOD AND APPARATUS FOR CODING/DECODING IMAGES, AND RECORDING MEDIA STORING A BITSTREAM |
KR102154407B1 (ko) * | 2018-11-15 | 2020-09-09 | 한국전자기술연구원 | 타일 기반 스트리밍을 위한 모션 제한 av1 영상 부호화 방법 및 장치 |
CN113170127A (zh) * | 2018-12-07 | 2021-07-23 | 三星电子株式会社 | 使用并行块和条带的视频编码方法和解码方法以及使用并行块和条带的视频编码装置和解码装置 |
WO2020124016A1 (en) * | 2018-12-14 | 2020-06-18 | Futurewei Technologies, Inc. | Arbitrary and wrap-around tile grouping |
US11252434B2 (en) * | 2018-12-31 | 2022-02-15 | Tencent America LLC | Method for wrap-around padding for omnidirectional media coding |
KR102392701B1 (ko) * | 2019-01-15 | 2022-04-28 | 엘지전자 주식회사 | 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치 |
US20200236377A1 (en) * | 2019-01-22 | 2020-07-23 | Tencent America LLC | Method for tile group identification |
US11095916B2 (en) * | 2019-07-23 | 2021-08-17 | Qualcomm Incorporated | Wraparound motion compensation in video coding |
US11297320B2 (en) * | 2020-01-10 | 2022-04-05 | Mediatek Inc. | Signaling quantization related parameters |
US11405649B2 (en) * | 2020-02-18 | 2022-08-02 | Mediatek Inc. | Specifying slice chunks of a slice within a tile |
TWI743919B (zh) * | 2020-08-03 | 2021-10-21 | 緯創資通股份有限公司 | 視訊處理裝置及視訊串流的處理方法 |
-
2020
- 2020-05-19 US US17/911,245 patent/US20230104270A1/en active Pending
- 2020-05-19 CN CN202080099262.1A patent/CN115349263A/zh active Pending
- 2020-05-19 JP JP2022565893A patent/JP2023524000A/ja active Pending
- 2020-05-19 WO PCT/US2020/033538 patent/WO2021236059A1/en unknown
- 2020-05-19 EP EP20731684.5A patent/EP3942836A1/en active Pending
- 2020-05-19 KR KR1020227034594A patent/KR20220146647A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2021236059A1 (en) | 2021-11-25 |
EP3942836A1 (en) | 2022-01-26 |
US20230104270A1 (en) | 2023-04-06 |
CN115349263A (zh) | 2022-11-15 |
KR20220146647A (ko) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220353534A1 (en) | Transform Kernel Selection and Entropy Coding | |
US20230104270A1 (en) | Dynamic Parameter Selection for Quality-Normalized Video Transcoding | |
US20190020888A1 (en) | Compound intra prediction for video coding | |
US11647223B2 (en) | Dynamic motion vector referencing for video coding | |
US11102477B2 (en) | DC coefficient sign coding scheme | |
US20220415039A1 (en) | Systems and Techniques for Retraining Models for Video Quality Assessment and for Transcoding Using the Retrained Models | |
CN110169059B (zh) | 视频代码化的复合预测 | |
CN113132728B (zh) | 编码方法及编码器 | |
US10419777B2 (en) | Non-causal overlapped block prediction in variable block size video coding | |
US20220094950A1 (en) | Inter-Prediction Mode-Dependent Transforms For Video Coding | |
JP7125559B2 (ja) | ビットレート削減のためのビデオストリーム適応フィルタリング | |
US20210329245A1 (en) | Transforms for large video and image blocks | |
JP2022069546A (ja) | 複合動き補償予測 | |
US11924449B2 (en) | Multivariate rate control for transcoding video content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221027 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240206 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240422 |